DeepSeek V4-Pro: Kinas billigste frontier-model gør 75 procents prisnedsættelse permanent

Den 22. maj 2026 bekræftede det kinesiske AI-selskab DeepSeek, at virksomhedens midlertidige 75 procents rabat på V4-Pro API’et ikke er midlertidigt mere. Rabatten er nu den permanente listepris. Det betyder, at DeepSeek V4-Pro nu koster $0,435 pr. million input-tokens og $0,87 pr. million output-tokens – og at modellen dermed er 11,5 gange billigere end GPT-5.5 på input og 34,5 gange billigere på output.

For udviklere, der arbejder med store mængder tekst eller agentiske workflows, er det en forskel, der slår igennem på bundlinjen. Men DeepSeek V4-Pro er ikke bare en billig model – den er faktisk en af de teknisk stærkeste open source-modeller tilgængelige i dag.

Hvad er DeepSeek V4-Pro?

DeepSeek V4-Pro blev frigivet den 24. april 2026 under en MIT-licens, som tillader kommerciel brug og finjustering. Modellen er en Mixture-of-Experts-arkitektur med 1,6 billioner parametre i alt, men kun 49 milliarder er aktive pr. token. Det svarer i praksis til, at du får kapaciteten fra en kæmpemodel, men betaler for inferens svarende til en 49 milliarder parametres model.

Kontekstvinduet er på én million tokens – det samme som GPT-5.5 – og i 1M-token-scenariet kræver DeepSeek V4-Pro kun 27 procent af de FLOPs og 10 procent af KV-cachen sammenlignet med forgængeren DeepSeek-V3.2. Det er en markant effektivitetsforbedring, og det er en af grundene til, at prisnedsættelser i denne størrelsesorden er mulige.

Modelvægtene er tilgængelige på Hugging Face, og modellen kan køres lokalt eller selvhostes med vLLM og SGLang. Det adskiller DeepSeek V4-Pro fra de fleste frontier-modeller, som kun er tilgængelige via proprietære API’er.

Benchmark-resultater: slår GPT-5.5 i kodning

DeepSeek V4-Pro’s benchmark-resultater er konkrete og svære at ignorere. På LiveCodeBench – en benchmark der tester kodeforståelse og generering – scorer modellen 93,5 i Pass@1. Det er den højeste score af alle modeller i skrivende stund. På Codeforces-ranglisten rammer DeepSeek V4-Pro en rating på 3.206, foran GPT-5.4 xHigh på 3.168 og Gemini 3.1 Pro på 3.052.

På SWE-bench Verified – den benchmark der tester evnen til at løse rigtige GitHub-issues – scorer DeepSeek V4-Pro 80,6 procent i sin maksimale reasoning-tilstand. Til sammenligning scorer Claude Opus 4.6 80,8 procent. Forskel på 0,2 procentpoint på tværs af frontier-modellerne – men prisforskellen er på en størrelsesorden.

Det er det samme mønster, vi så, da GPT-5.5 blev lanceret: topresultater, men til priser der gør det svært at retfærdiggøre for de fleste use cases. DeepSeek V4-Pro vender den logik på hovedet.

Hvad det permanente prisnedsættelse faktisk betyder for udviklere

Den officielle permanente pris pr. 22. maj 2026 er:

Input (cache-miss): $0,435 pr. million tokens
Input (cache-hit): $0,003625 pr. million tokens
Output: $0,87 pr. million tokens

Til sammenligning koster GPT-5.5 $5,00 pr. million input-tokens og $30,00 pr. million output-tokens. Det er ikke en marginal forskel. Det er en størrelsesorden.

For agentic workflows, der kræver mange model-kald med lange kontekster, kan DeepSeek V4-Pro reducere API-regningen med 90 procent eller mere sammenlignet med GPT-5.5. Det er den slags tal, der tvinger enterprise-budgetansvarlige til at tage beslutninger – og det er sandsynligvis præcis, hvad DeepSeek sigter efter.

Den kinesiske dimension: hvad du bør overveje

DeepSeek er et kinesisk selskab underlagt kinesisk lovgivning. Det er præcis den samme problemstilling, vi så med Qwen3.7-Max fra Alibaba: imponerende teknisk kvalitet kombineret med en datasikkerhedsrisiko, der ikke kan ignoreres.

Kinesisk lovgivning pålægger virksomheder at stille data til rådighed for staten på anmodning. Hvad det i praksis indebærer for data sendt til DeepSeeks API-endpoints, er uklart – men risikoen er reel. Prompts der indeholder fortrolige forretningsoplysninger, kildekode eller persondata, bør ikke sendes til kinesisk-kontrollerede API’er uden en klar risikovurdering.

Det er muligt at undgå dette problem ved at selvhoste DeepSeek V4-Pro, da modelvægtene er offentligt tilgængelige. Men en 1,6 billioners-parameter MoE-model kræver massiv GPU-kapacitet. Den mest realistiske strategi for de fleste organisationer er at bruge modellen til ikke-følsomt arbejde via API’et, eller at afvente, at europæiske cloud-udbydere tilbyder den med lokal hosting.

Censur er en anden faktor. Ligesom andre kinesiske modeller vil DeepSeek V4-Pro afvise prompts om emner, der er politisk følsomme i Kina. For de fleste kommercielle use cases er det irrelevant – men det er en begrænsning, der bør registreres.

Hvornår giver DeepSeek V4-Pro mening at bruge?

Med ovenstående forbehold in mente er der klare scenarier, hvor DeepSeek V4-Pro giver mening:

Kodegenerering og debugging med ikke-proprietær kode
Analyse af store dokumentmængder uden fortroligt indhold
Prototype-arbejde og evaluering, hvor pris pr. kald er afgørende
Batch-behandling af teknisk tekst, der ikke er forretningskritisk
Lokal selvhosting, hvis GPU-kapaciteten er til det

Hverken GPT-5.5 eller Claude Opus 4.8 er truet som topmodeller til avanceret reasoning og komplekse agentiske opgaver. Men DeepSeek V4-Pro har gjort det klart, at priskonkurrencen i open source-segmentet er ved at nå frontier-niveau. Det er en tendens, der ikke stopper her – og den påvirker, hvad du fremover kan forvente at betale for adgang til frontier-kvalitet i LLM-verdenen.