16 AI-agenter byggede en C-compiler fra bunden — og den kan kompilere Linux-kernen

Hvad sker der, når du sætter 16 AI-agenter løs på et af datalogi-verdenens sværeste problemer — at bygge en C-compiler fra bunden? Det har Anthropics forsker Nicholas Carlini testet, og resultatet hedder Claude C Compiler (CCC): en Rust-baseret compiler med 100.000 linjer kode, der faktisk kan kompilere Linux-kernen på x86, ARM og RISC-V.

Sådan fungerer agent teams

Carlini brugte en ny tilgang kaldet agent teams, hvor flere Claude Code-instanser arbejder parallelt på den samme kodebase — hver i sin egen Docker-container. I alt kørte projektet næsten 2.000 Claude Code-sessioner til en samlet API-omkostning på ca. $20.000.

Arkitekturen er overraskende enkel: et git-repo fungerer som central hub, og hver agent kloner en lokal kopi i sin container. Agenterne koordinerer via et simpelt låsesystem — de skriver tekstfiler til en current_tasks/-mappe for at “reservere” opgaver. Git’s egen synkronisering forhindrer to agenter i at arbejde på det samme problem samtidig.

Claude C Compiler - 16 AI-agenter bygger compiler

Ingen orkestrator — agenterne styrer selv

Det mest bemærkelsesværdige er måske, at der ikke er nogen central orkestrator. Hver agent beslutter selv, hvad der er den “næste mest oplagte” opgave. Når en agent sidder fast, vedligeholder den et løbende dokument over mislykkede forsøg og resterende opgaver. Det hele kører i en uendelig loop — og ja, Carlini bemærker tørt, at en agent på et tidspunkt ved et uheld kørte pkill -9 bash og dermed dræbte sig selv.

Hvad Chris Lattner siger om koden

Chris Lattner — skaberen af Swift, LLVM og Clang — har gennemgået koden og er generelt imponeret. Han sammenligner resultatet med “et kompetent lærebogs-implementation, den type system et stærkt hold af studerende kunne bygge tidligt i et projekt.” Men han påpeger også begrænsninger: compileren optimerer mod at bestå tests snarere end at bygge generelle abstraktioner, som et menneske ville.

Lattner konkluderer, at Claude C Compiler demonstrerer, at AI-systemer er fremragende til at samle kendte teknikker og optimere mod målbare succeskriterier — men stadig kæmper med den åbne generalisering, der kræves til produktionskvalitet.

Lektioner for agentic engineering

Carlinis vigtigste indsigter handler ikke om compileren selv, men om hvordan man designer miljøer til autonome AI-agenter:

Tests er alt: Agenter løser det problem, tests definerer. Hvis test-harnessen ikke er tæt på perfekt, løser agenterne det forkerte problem.
Kontekstforurening: Test-output bør minimeres — tusindvis af linjer fylder kontekstvinduet op. Log til filer, brug grep-venlige formater.
Tidsblindhed: Claude kan ikke se klokken og vil gladelig bruge timer på at køre tests. En --fast-option der kun kører 1-10% af tests er essentiel.
Dokumentation som infrastruktur: Agenter orienterer sig via README-filer og progress-dokumenter, ikke ved at læse al kode.

Disse lektioner er direkte anvendelige for alle, der arbejder med agent teams og multi-agent-arkitekturer i Claude Code.

Perspektiv: fra kodegenerering til ingeniørarbejde

Claude C Compiler markerer et skifte. AI bevæger sig fra lokal kodegenerering — at skrive funktioner og scripts — til at deltage i egentligt ingeniørarbejde: at vedligeholde arkitektur på tværs af delsystemer, iterere mod korrekthed over tid, og operere i komplekse feedback-loops.

Det rejser også spørgsmål om gennemsigtighed: når AI-systemer trænet på årtiers offentligt tilgængelig kode kan reproducere velkendte mønstre og implementationer, hvor går grænsen mellem læring og kopiering?

Koden er open source og tilgængelig på GitHub. Det er fascinerende læsning — ikke mindst git-historikken, hvor man kan følge agenterne tage låse på opgaver, løse problemer og merge hinandens ændringer.

Denne artikel er skrevet i samarbejde med AI, og efterfølgende redigeret af et rigtigt menneske 🙂