Claude Opus 4.6 Fast Mode: 2,5x hurtigere — men til hvilken pris?

Anthropic har netop lanceret “Fast Mode” til Claude Opus 4.6 — en 2,5 gange hurtigere variant af deres frontier-model, tilgængelig direkte i Claude Code via /fast-kommandoen.

Hvad er Fast Mode?

Anthropics interne teams har i et stykke tid bygget med en accelereret version af Opus 4.6. Nu gør de den tilgængelig som et “research preview” for alle Claude Code-brugere med extra usage aktiveret. Kommandoen er simpel: skriv /fast i Claude Code, og modellen skifter gear.

Ifølge Anthropic leverer Fast Mode “Opus-level intelligence” med markant hurtigere responstider — op til 2,5x sammenlignet med standard Opus 4.6. Det er designet til tidskritiske projekter og komplekse kodningsopgaver, hvor ventetid på AI-svar er en reel flaskehals.

Prisen: 6x dyrere (3x med rabat)

Her kommer den interessante del for dem, der holder øje med token-økonomi. Standard Opus 4.6 koster $5 pr. million input-tokens og $25 pr. million output-tokens. Fast Mode koster:

$30/million input (6x standard)
$150/million output (6x standard)

Anthropic tilbyder dog 50% rabat indtil 16. februar, hvilket bringer prisen ned til “kun” 3x standard. Stadig en heftig premium.

Context window og priseskalering

Opus 4.6 har mulighed for at udvide context window fra 200.000 til 1.000.000 tokens. Ved brug over 200K tokens stiger prisen til 2x input ($10/m) og 1,5x output ($37,50/m). Disse multiplikatorer gælder også for Fast Mode.

Det betyder, at man efter rabatten udløber kan betale op til $60 pr. million input og $225 pr. million output for den hurtigste, mest kapable model med fuldt context window. Det er serious money — men for enterprise-teams der bygger komplekse agentic workflows, kan latency-reduktionen godt betale sig.

Hvem er det til?

Fast Mode er ikke for hverdags-prompts. Det er for udviklere der:

Kører iterative agentic loops, hvor hvert API-kald tager 30-60 sekunder med standard Opus
Har “inner loop” development workflows, hvor AI-latency er den primære flaskehals
Bygger tidskritiske applikationer, hvor hurtig turnaround er afgørende
Har budgettet til at betale premium for produktivitet

Perspektiv: Latency som konkurrenceparameter

Det er værd at bemærke, at dette er et strategisk træk. Med OpenAIs o3-modeller og Googles Gemini 2.5 der også kæmper om udviklernes opmærksomhed, positionerer Anthropic sig tydeligt: man kan få den bedste model og den hurtigste — hvis man er villig til at betale. Det er en pay-to-win-mekanisme for agentic engineering workflows, og det signalerer at latency bliver den næste store kampplads i AI-infrastruktur.

Foreløbig er Fast Mode et “early experiment”. Priserne vil formentlig blive justeret, og det er ikke utænkeligt at konkurrenter følger efter med tilsvarende premium-tiers. For nu er budskabet klart: hastighed koster — men for de rigtige use cases kan det være en game changer.