Claude Mythos Preview: Anthropics kraftigste model finder zero-days autonomt og er på vej til alle

Den 7. april 2026 annoncerede Anthropic noget usædvanligt: en ny sprogmodel – Claude Mythos Preview – der er markant kraftigere end alt, de tidligere har frigivet. Men i modsætning til sædvanlige modeludgivelser kom Mythos ikke på claude.ai eller via API. Den er stadig forbeholdt en snæver kreds af udvalgte partnere. Det er ved at ændre sig.

Et kapabilitetsmæssigt spring

Tallene er markante. Claude Mythos Preview scorer 93,9% på SWE-bench Verified – det benchmark, der bedst afspejler, om en model kan løse rigtige softwareproblemer under produktionslignende forhold. Til sammenligning scorer Claude Opus 4.6 42,3% på USAMO 2026 (USA Mathematical Olympiad), mens Mythos lander på 97,6% – et hop på 55,3 procentpoint. Det er ikke en iteration. Det er en ny kategori.

På Terminal-Bench 2.0, som tester agentisk systeminteraktion med rigtige terminaler og filer, opnår Claude Mythos Preview 82,0%. SWE-bench Pro – der er tættere på produktionskode-niveau end den normale SWE-bench – lander på 77,8%. Disse tal placerer Mythos et fuldt niveau over Claude Opus 4.8, som selv er en stærk model med 69,2% SWE-bench Pro.

Modellen, der jager zero-days

Det mest opsigtsvækkende ved Claude Mythos Preview er dog ikke benchmark-resultaterne – det er hvad modellen gør, når den får adgang til rigtige systemer. Anthropic rapporterede, at Mythos autonomt fandt og udnyttede to særdeles alvorlige sikkerhedssårbarheder, der aldrig tidligere var opdaget:

En 27 år gammel denial-of-service-sårbarhed i OpenBSDs TCP SACK-implementering – en integer overflow, der kan crashe ethvert OpenBSD-system via TCP-forbindelser
En 17 år gammel remote code execution-sårbarhed i FreeBSDs NFS-implementering (CVE-2026-4747), der giver en uauthenticeret angriber fuld root-adgang fra nettet

Ingen mennesker var involveret i hverken opdagelse eller udnyttelse efter den indledende prompte. Ifølge Anthropic identificerede Mythos Preview tusindvis af zero-day-sårbarheder i alle større styresystemer og webbrowsere. Det britiske AI Security Institute evaluerede modellen på ekspertniveau hackeropgaver og rapporterede en succesrate på 73% – på opgaver, som ingen AI-model kunne løse blot et år tidligere.

Det er et paradigmeskifte. Vi taler ikke om en model, der hjælper en sikkerhedsanalytiker med at søge i CVE-databaser. Vi taler om en model, der selvstændigt gennemgår kildekode, identificerer sårbare mønstre og konstruerer fungerende exploits. Det er et niveau, der hidtil har krævet årtiers menneskelig ekspertise.

Project Glasswing – den kontrollerede åbning

Anthropic valgte en anden tilgang end de fleste AI-virksomheder. I stedet for en bred offentlig frigivelse lancerede de Project Glasswing: en invitationsbaseret adgang begrænset til 12 grundlæggerorganisationer og ca. 40 verificerede operatører af kritisk infrastruktur. Partnerne fik adgang til Claude Mythos Preview med ét primært formål: at finde og fixe sikkerhedssårbarheder i deres egne systemer, inden angribere finder dem.

Det er et klogt design. En model med Mythos-niveau kapabilitet inden for offensiv sikkerhed er for kraftfuld til ukontrolleret adgang. Anthropic erkender det åbent og har valgt en defensiv brug som det første skridt. Modellen bruges til at styrke kritisk infrastruktur – ikke til at sætte den under pres.

Det minder lidt om den tilgang, vi så med Anthropics MCP-tunneler og selvhostede sandboxes – en gradvis åbning med fokus på kontrol og sikkerhed frem for maksimal adoption.

Bredere frigivelse er på vej

I slutningen af maj 2026 brød Anthropic med den stille Project Glasswing-strategi og annoncerede direkte: “Vi forventer at bringe Mythos-klasse modeller til alle vores kunder i de kommende uger.” Det er bemærkelsesværdigt fra en virksomhed, der befinder sig i et ekstremt konkurrencepræget marked mod OpenAI og Google.

Prediction-markedet Polymarket prissætter aktuelt 30% sandsynlighed for offentlig frigivelse inden 30. juni og 66% inden 31. juli 2026. Tidslinjen er – usædvanligt nok – drevet af sikkerhedsevalueringer frem for kommercielle planer, og det skiller dem ud i en branche, der ellers handler på hastighed.

Hvad det betyder for udviklere og IT-organisationer

Når Mythos-klasse modeller rammer den brede API-adgang – uanset om det sker under det navn eller som en ny Claude-variant – vil det have konkrete konsekvenser:

Coding agents rykker yderligere op i kompleksitetsniveauet og vil kunne håndtere opgaver, der i dag kræver seniorniveau erfaring
Sikkerheds-tooling bygget på Claude vil potentielt kunne identificere sårbarheder, der i dag kræver specialiserede penetrationstestere
Risikomodellen ændrer sig på begge sider: forsvarende teams får bedre AI-drevne scanningsværktøjer, mens offensive aktører potentielt også får adgang til kraftfulde modeller via mindre skrupelløse udbydere

For IT-organisationer, der allerede bruger Claude i produktionssystemer, er det et godt tidspunkt at begynde at tænke på, hvad Mythos-niveau kapabilitet ændrer i jeres trussels- og mulighedsbillede. Anthropics Project Glasswing har allerede demonstreret, at de rigtige håndterer det ansvarsfuldt. Spørgsmålet er, om resten af markedet gør det samme, når den teknologi uundgåeligt spreder sig.