Claude Opus 4.8: Dynamic Workflows med hundredvis af subagenter og 69% SWE-Bench Pro

2 min read

Anthropic udgav i går Claude Opus 4.8 – den seneste opdatering til sin flagskibsmodel. Det er knap seks uger siden Opus 4.7 kom ud, og tempoet i Anthropics udgivelseskadence er ikke ved at falde. Samme dag annoncerede virksomheden en massiv Series H-finansieringsrunde: $65 milliarder til en samlet verdi på $965 milliarder, ledet af Altimeter Capital, Dragoneer, Greenoaks og Sequoia Capital.

Men lad os starte med selve modellen.

Hvad er nyt i Claude Opus 4.8?

Den mest konkrete forbedring er på agentic coding. Claude Opus 4.8 scorer 69,2% på SWE-Bench Pro, op fra 64,3% i Opus 4.7. Det er en stigning på knap fem procentpoint og placerer modellen foran GPT-5.5 og Gemini 3.1 Pro på den benchmark. Multidisciplinær reasoning med redskaber er gået fra 54,7% til 57,9%. Der er stadig et hul til GPT-5.5 på terminal-coding, men på de fleste agentic benchmarks tager Opus 4.8 teten.

En anden markant ændring er fart. Anthropic skriver at fast mode er 2,5 gange hurtigere end i den forrige version. Det er ikke uvæsentligt for udviklere der kører modellen i lange autonome sessioner. Prisen er uændret fra Opus 4.7.

Dynamic Workflows: hundredvis af parallelle subagenter

Den mest interessante nyhed er den funktion Anthropic kalder Dynamic Workflows, som er i research preview. Det er en mekanisme der giver Claude mulighed for at koordinere hundredvis af parallelle subagenter (subagenter er selvstændige AI-processer der arbejder på en delmængde af en større opgave) i en enkelt session.

Casen Anthropic fremhæver er storskalerede kodebasmigrerationer – eksempelvis en refaktorering på tværs af hundredtusinder af kodelinjer. I stedet for at Claude behandler koden sekventielt, kan den nu planlægge arbejdet, dele det op og køre parallelle subagenter der håndterer hver sin del. Det svarer til den slags orkestrering man ellers selv skulle bygge med rammer som LangGraph eller AutoGen, bare integreret direkte i Claude Code.

Det er et naturligt næste trin i forlængelse af det arbejde Anthropic har lagt i MCP-infrastrukturen. For nylig åbnede de for selvhostede sandboxes og private MCP-tunnels, og Dynamic Workflows er en overbygning der giver mening oven på den infrastruktur.

Mere ærlig og Effort Control

Anthropic beskriver Opus 4.8 som mere “ærlig” end sine forgængere. Konkret betyder det at modellen er mindre tilbøjelig til at fremsætte påstande den ikke kan underbygge, og mere tilbøjelig til at markere usikkerhed i sit eget arbejde. Det er en subtil men vigtig forskel for produktionsbrugere der skal stole på modellens output i automatiserede pipelines.

En ny funktion kaldet Effort Control lader brugere justere, hvor meget computerkraft Claude bruger på et svar. Lavere indsats giver hurtigere svar og bruger færre rate limit-enheder; højere indsats giver dybere analyse til en højere pris. Det er en fornuftig ergonomisk forbedring for dem der bruger Claude til mange og varierende opgaver i løbet af en dag.

Tilgængelighed og penge

Opus 4.8 er tilgængeligt fra dag ét via Claude API, Amazon Bedrock og Google Vertex AI, med 200.000 tokens kontekst på Microsoft Foundry. Anthropic er dermed den første frontier-modeludbyder der er distribueret på alle tre store cloud-platforme samtidig.

Og så er der pengene. $65 milliarder i ny kapital ved en samlet verdi på $965 milliarder er et tal der fortjener at blive sagt højt. OpenAI er til sammenligning sidst valueret til $850 milliarder. Begge selskaber forventes at gå på børsen senere i 2026. Det er en branche der konsekvent tiltrækker kapital i en skala der gør alle andre tech-investeringer se beskedne ud.

Endelig annoncerede Anthropic at virksomheden i de kommende uger vil begynde at rulle Mythos-klasse modeller ud til kunder. Hvad Mythos præcist indebærer har Anthropic ikke specificeret yderligere, men det har været det mest omtalte navn i selskabets kommende lineup i måneder. Benchmark-pres fra alle sider er ikke ligefrem faldet, og Mythos bliver sandsynligvis en direkte reaktion på det.

Kilder

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *