Den 22. maj 2026 bekræftede det kinesiske AI-selskab DeepSeek, at virksomhedens midlertidige 75 procents rabat på V4-Pro API’et ikke er midlertidigt mere. Rabatten er nu den permanente listepris. Det betyder, at DeepSeek V4-Pro nu koster $0,435 pr. million input-tokens og $0,87 pr. million output-tokens – og at modellen dermed er 11,5 gange billigere end GPT-5.5 på input og 34,5 gange billigere på output.
For udviklere, der arbejder med store mængder tekst eller agentiske workflows, er det en forskel, der slår igennem på bundlinjen. Men DeepSeek V4-Pro er ikke bare en billig model – den er faktisk en af de teknisk stærkeste open source-modeller tilgængelige i dag.
Hvad er DeepSeek V4-Pro?
DeepSeek V4-Pro blev frigivet den 24. april 2026 under en MIT-licens, som tillader kommerciel brug og finjustering. Modellen er en Mixture-of-Experts-arkitektur med 1,6 billioner parametre i alt, men kun 49 milliarder er aktive pr. token. Det svarer i praksis til, at du får kapaciteten fra en kæmpemodel, men betaler for inferens svarende til en 49 milliarder parametres model.
Kontekstvinduet er på én million tokens – det samme som GPT-5.5 – og i 1M-token-scenariet kræver DeepSeek V4-Pro kun 27 procent af de FLOPs og 10 procent af KV-cachen sammenlignet med forgængeren DeepSeek-V3.2. Det er en markant effektivitetsforbedring, og det er en af grundene til, at prisnedsættelser i denne størrelsesorden er mulige.
Modelvægtene er tilgængelige på Hugging Face, og modellen kan køres lokalt eller selvhostes med vLLM og SGLang. Det adskiller DeepSeek V4-Pro fra de fleste frontier-modeller, som kun er tilgængelige via proprietære API’er.
Benchmark-resultater: slår GPT-5.5 i kodning
DeepSeek V4-Pro’s benchmark-resultater er konkrete og svære at ignorere. På LiveCodeBench – en benchmark der tester kodeforståelse og generering – scorer modellen 93,5 i Pass@1. Det er den højeste score af alle modeller i skrivende stund. På Codeforces-ranglisten rammer DeepSeek V4-Pro en rating på 3.206, foran GPT-5.4 xHigh på 3.168 og Gemini 3.1 Pro på 3.052.
På SWE-bench Verified – den benchmark der tester evnen til at løse rigtige GitHub-issues – scorer DeepSeek V4-Pro 80,6 procent i sin maksimale reasoning-tilstand. Til sammenligning scorer Claude Opus 4.6 80,8 procent. Forskel på 0,2 procentpoint på tværs af frontier-modellerne – men prisforskellen er på en størrelsesorden.
Det er det samme mønster, vi så, da GPT-5.5 blev lanceret: topresultater, men til priser der gør det svært at retfærdiggøre for de fleste use cases. DeepSeek V4-Pro vender den logik på hovedet.
Hvad det permanente prisnedsættelse faktisk betyder for udviklere
Den officielle permanente pris pr. 22. maj 2026 er:
- Input (cache-miss): $0,435 pr. million tokens
- Input (cache-hit): $0,003625 pr. million tokens
- Output: $0,87 pr. million tokens
Til sammenligning koster GPT-5.5 $5,00 pr. million input-tokens og $30,00 pr. million output-tokens. Det er ikke en marginal forskel. Det er en størrelsesorden.
For agentic workflows, der kræver mange model-kald med lange kontekster, kan DeepSeek V4-Pro reducere API-regningen med 90 procent eller mere sammenlignet med GPT-5.5. Det er den slags tal, der tvinger enterprise-budgetansvarlige til at tage beslutninger – og det er sandsynligvis præcis, hvad DeepSeek sigter efter.
Den kinesiske dimension: hvad du bør overveje
DeepSeek er et kinesisk selskab underlagt kinesisk lovgivning. Det er præcis den samme problemstilling, vi så med Qwen3.7-Max fra Alibaba: imponerende teknisk kvalitet kombineret med en datasikkerhedsrisiko, der ikke kan ignoreres.
Kinesisk lovgivning pålægger virksomheder at stille data til rådighed for staten på anmodning. Hvad det i praksis indebærer for data sendt til DeepSeeks API-endpoints, er uklart – men risikoen er reel. Prompts der indeholder fortrolige forretningsoplysninger, kildekode eller persondata, bør ikke sendes til kinesisk-kontrollerede API’er uden en klar risikovurdering.
Det er muligt at undgå dette problem ved at selvhoste DeepSeek V4-Pro, da modelvægtene er offentligt tilgængelige. Men en 1,6 billioners-parameter MoE-model kræver massiv GPU-kapacitet. Den mest realistiske strategi for de fleste organisationer er at bruge modellen til ikke-følsomt arbejde via API’et, eller at afvente, at europæiske cloud-udbydere tilbyder den med lokal hosting.
Censur er en anden faktor. Ligesom andre kinesiske modeller vil DeepSeek V4-Pro afvise prompts om emner, der er politisk følsomme i Kina. For de fleste kommercielle use cases er det irrelevant – men det er en begrænsning, der bør registreres.
Hvornår giver DeepSeek V4-Pro mening at bruge?
Med ovenstående forbehold in mente er der klare scenarier, hvor DeepSeek V4-Pro giver mening:
- Kodegenerering og debugging med ikke-proprietær kode
- Analyse af store dokumentmængder uden fortroligt indhold
- Prototype-arbejde og evaluering, hvor pris pr. kald er afgørende
- Batch-behandling af teknisk tekst, der ikke er forretningskritisk
- Lokal selvhosting, hvis GPU-kapaciteten er til det
Hverken GPT-5.5 eller Claude Opus 4.8 er truet som topmodeller til avanceret reasoning og komplekse agentiske opgaver. Men DeepSeek V4-Pro har gjort det klart, at priskonkurrencen i open source-segmentet er ved at nå frontier-niveau. Det er en tendens, der ikke stopper her – og den påvirker, hvad du fremover kan forvente at betale for adgang til frontier-kvalitet i LLM-verdenen.
Kilder
- DeepSeek V4-Pro 75% Price Cut Goes Permanent: What It Means for Developers – CoderSera, maj 2026
- DeepSeek V4-Pro – Intelligence, Performance & Price Analysis – Artificial Analysis, 2026
- DeepSeek’s steep V4-Pro price cut escalates AI pricing war – InfoWorld, maj 2026
- DeepSeek-V4-Pro på HuggingFace – DeepSeek AI
- DeepSeek To Make Permanent 75% Discount on Flagship AI Model – Bloomberg, 23. maj 2026