Claude Code Agent Teams: Multi-agent workflows ændrer spillereglerne for udviklere

Med lanceringen af Claude Opus 4.6 den 5. februar introducerer Anthropic en ny feature i Claude Code kaldet “Agent Teams” — et multi-agent system der lader flere AI-agenter arbejde parallelt og koordinere autonomt på tværs af en codebase. Det er den mest markante ændring i agentic coding-landskabet i år, og det fortjener et teknisk deep-dive.

Hvad er Agent Teams?

Agent Teams er en research preview-feature i Claude Code der bryder med den traditionelle “én agent, én opgave”-model. I stedet kan udviklere nu spawne flere sub-agenter der arbejder parallelt på forskellige dele af en codebase — og som koordinerer deres arbejde autonomt.

Konkret betyder det: Du kan bede Claude Code om at lave en codebase review, og i stedet for at en enkelt agent kæmper sig lineært igennem tusindvis af filer, kan systemet nu fordele arbejdet på tværs af flere agenter. Hver sub-agent fokuserer på sit domæne og rapporterer fund tilbage til en koordinerende agent.

Det smarte er at hver sub-agent kan overtages interaktivt — også via tmux — hvilket passer perfekt ind i terminal-centriske workflows. Du mister ikke kontrollen, selvom du lader agenterne løbe.

Hvorfor er det vigtigt for udviklere?

Agent Teams adresserer et af de mest fundamentale problemer i agentic coding: sekventiel flaskehals. Når en AI-agent skal navigere en stor codebase, er den begrænset af at den kun kan fokusere på ét sted ad gangen. Med parallel eksekvering af flere agenter kan read-heavy operationer — code reviews, dependency-analyse, test-generering — skaleres horisontalt.

For teams der allerede bruger Claude Code i deres daglige workflow, er det en potentiel game-changer. Forestil dig at starte en PR-review hvor:

Agent A gennemgår alle ændrede filer for logiske fejl
Agent B tjekker for security-problemer
Agent C verificerer at tests dækker de nye code paths
En koordinator samler fund og præsenterer en samlet review

Opus 4.6: Motoren bag Agent Teams

Agent Teams ville ikke fungere uden Opus 4.6’s tekniske forbedringer. Her er de vigtigste:

1 million tokens kontekstvindue (beta): Opus 4.6 er den første Opus-model med 1M token kontekst. Det betyder at hver sub-agent kan holde en enorm mængde kode i “hukommelsen” — kritisk for store codebases.
Op til 128K output tokens: En agent kan nu generere meget lange, strukturerede outputs — hele code reviews, multi-fil edits eller detaljerede rapporter i ét svar.
Adaptive Reasoning: Modellen kan dynamisk justere hvor dybt den “tænker” baseret på opgavens kompleksitet. Simpel kode? Hurtig respons. Kompleks arkitektur-beslutning? Dyb reasoning.
Effort Controls (4 niveauer): Via en /effort-parameter kan udviklere vælge mellem low, medium, high og max — en direkte trade-off mellem latency/cost og reasoning-kvalitet.
Context Compaction (beta): Platformen kan automatisk opsummere og erstatte ældre dele af en konversation, så lange agent-sessioner ikke løber tør for kontekst.

Benchmark-resultater der underbygger det

Opus 4.6 topper flere relevante benchmarks:

Terminal-Bench 2.0: Højeste score nogensinde på dette agentic coding benchmark
MRCR v2 (1M tokens): 76% accuracy vs. 18,5% for Claude Sonnet 4.5 — et kvalitativt spring i long-context retrieval
BrowseComp: Bedste resultat af alle modeller på agentic search — med multi-agent harness op til 86,8%
GDPval-AA: Slår GPT-5.2 med ~144 Elo-point på videnstunge opgaver

Særligt MRCR v2-resultatet er relevant for Agent Teams: Evnen til at finde specifikke informationer begravet i 1 million tokens tekst er præcis det en code-review-agent har brug for.

Hvad betyder det for agentic engineering?

Agent Teams markerer et skifte fra “AI som værktøj” til “AI som team-medlem.” Det er ikke længere én copilot der sidder ved siden af dig — det er et helt team af specialiserede agenter der kan koordinere, fordele arbejde og rapportere tilbage.

For agentic engineering som disciplin er implikationerne store:

Orchestration bliver en kernekompetence. At designe effektive multi-agent workflows — hvem gør hvad, hvordan koordineres, hvornår eskaleres til menneske — bliver en central skill.
Terminal-first arkitektur vinder. At Agent Teams integrerer med tmux viser at Anthropic satser på udviklere der lever i terminalen. IDE-baserede løsninger kan have sværere ved at matche denne fleksibilitet.
Cost management bliver komplekst. Flere parallelle agenter med 1M token kontekst kan hurtigt brænde credits. Effort controls og adaptive reasoning er ikke nice-to-have — de er nødvendige for at holde budgettet.
Review-workflows transformeres. Den første og mest oplagte use case er code review. Forvent at se teams gå fra manuelle PR-reviews til agent-assisterede reviews inden for måneder.

Perspektiv

Agent Teams er stadig i research preview, og der er åbne spørgsmål: Hvordan håndteres konflikter når to agenter vil ændre den samme fil? Hvordan skalerer cost med antal parallelle agenter? Og hvor godt fungerer koordineringen i praksis på rigtig store monorepos?

Men retningen er klar. Vi bevæger os fra single-agent coding assistants mod multi-agent development teams. Og med Opus 4.6’s kombination af 1M token kontekst, adaptive reasoning og effort controls har Anthropic bygget det fundament der skal til.

For udviklere der endnu ikke har prøvet Claude Code, er der aldrig været et bedre tidspunkt at starte. Og for dem der allerede bruger det dagligt: Agent Teams er det næste kapitel.

Kilder: Anthropic Blog, MarkTechPost, Hacker News

Denne artikel er skrevet i samarbejde med AI, og efterfølgende redigeret af et rigtigt menneske 🙂