Claude Sonnet 4.6: Opus-intelligens til en tredjedel af prisen

2 min read

Anthropic lancerede i går Claude Sonnet 4.6 — og det er ikke bare endnu en model-opdatering. Det er et paradigmeskift i hvad en mellemklasse-model kan levere.

Sonnet-serien har altid været den fornuftige mellem: hurtigere og billigere end Opus, men med kompromiser på kvalitet. Den tid er forbi. Sonnet 4.6 nærmer sig Opus-niveau på næsten alle benchmarks — til $3/$15 per million tokens mod Opus’ $15/$75.

Testere foretrækker den over Opus 4.5

Det mest overraskende tal i Anthropics annoncering: udviklere i Claude Code foretrak Sonnet 4.6 over Opus 4.5 (den dyreste model fra november 2025) i 59% af tilfældene. Over forgængeren Sonnet 4.5 var præferencen hele 70%.

Hvad driver den præference? Ifølge testerne:

  • Modellen læser konteksten før den ændrer kode, i stedet for at skyde fra hoften
  • Den konsoliderer delt logik frem for at duplikere den
  • Færre falske successer og hallucinationer
  • Markant bedre til at følge instruktioner over lange sessioner
  • Mindre tilbøjelig til overengineering — den løser problemet, ikke alle tænkelige fremtidige problemer

For alle der har siddet med en AI-assistent der insisterer på at refaktorere hele kodebasen når man bare bad den fikse en knap — det er præcis den forbedring man mærker.

Computer Use: fra eksperiment til arbejdsredskab

I oktober 2024 introducerede Anthropic computer use som den første udbyder. Dengang kaldte de det selv “eksperimentelt og fejlbehæftet.” 16 måneder senere er billedet et helt andet.

Sonnet 4.6 viser en markant forbedring på OSWorld-benchmarket, der tester AI’s evne til at bruge rigtige programmer — Chrome, LibreOffice, VS Code — via mus og tastatur, præcis som et menneske. Tidlige brugere rapporterer “human-level capability” på opgaver som at navigere komplekse regneark og udfylde flertrinformularer på tværs af browser-tabs.

Lige så vigtigt: Sonnet 4.6 er markant mere modstandsdygtig over for prompt injection-angreb end Sonnet 4.5 — på niveau med Opus 4.6. Det er kritisk for en model der styrer en rigtig computer.

1 million tokens kontekst

Sonnet 4.6 lanceres med 1M token context window i beta. Det er nok til hele kodebaser, langvarige kontrakter eller snesevis af forskningsartikler i et enkelt request. Men det vigtige er ikke bare størrelsen — det er at modellen faktisk ræsonnerer effektivt på tværs af al den kontekst.

Anthropic demonstrerede dette med Vending-Bench Arena, en evaluering der tester hvor godt en model kan drive en simuleret forretning over tid. Sonnet 4.6 udviklede spontant en strategi: den investerede tungt i kapacitet de første ti måneder, brugte markant mere end konkurrenterne, og pivoterede så skarpt til profitabilitet i slutspurten. Timingen af pivoteringen var præcis nok til at vinde overlegent.

Hvad det betyder i praksis

Med Sonnet 4.6 får gratis- og Pro-brugere på claude.ai en model der matcher — og på nogle områder overgår — det der for tre måneder siden var forbeholdt den dyreste Opus-model. Det er en demokratisering af AI-kapacitet i et tempo der er svært at følge med i.

For udviklere der bruger Claude Code dagligt (som undertegnede) er forbedringerne i instruktionsfølge og konsolidering af kode de vigtigste. En model der lytter og gør hvad man beder om — frem for hvad den selv synes er smart — er forskellen mellem et produktivt værktøj og en frustrerende makker.

Og med computer use der nærmer sig human-level, er det ikke svært at forestille sig en nær fremtid hvor din AI-assistent simpelthen kan udføre kontorarbejde på din computer — navigere ERP-systemer, udfylde formularer, samle data fra flere kilder — uden at du behøver bygge integrationer.

Sonnet 4.6 er tilgængelig nu i claude.ai, Claude Cowork og via API. Prisen er uændret: $3 per million input-tokens, $15 per million output-tokens.

Fuld teknisk gennemgang i Anthropics system card.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *