{"id":1296,"date":"2026-04-24T12:37:21","date_gmt":"2026-04-24T10:37:21","guid":{"rendered":"https:\/\/vittrup-graversen.dk\/?p=1296"},"modified":"2026-04-24T12:37:22","modified_gmt":"2026-04-24T10:37:22","slug":"gpt-5-5-vs-claude-opus-4-7-hvem-vinder-den-agentiske-kodekamp","status":"publish","type":"post","link":"https:\/\/vittrup-graversen.dk\/index.php\/2026\/04\/24\/gpt-5-5-vs-claude-opus-4-7-hvem-vinder-den-agentiske-kodekamp\/","title":{"rendered":"GPT-5.5 vs Claude Opus 4.7: Hvem vinder den agentiske kodekamp?"},"content":{"rendered":"\n<p>OpenAI og Anthropic har sat hinanden skakmat p\u00e5 kalenderen. Claude Opus 4.7 landede 16. april. En uge senere, 23. april 2026, slap OpenAI GPT-5.5 ud i ChatGPT og Codex. Det er f\u00f8rste gang siden GPT-4.5, at OpenAI har gen-tr\u00e6net basismodellen helt fra bunden, og de markedsf\u00f8rer den ikke som en chatbot, men som en agent der skal kunne betjene din computer. Sp\u00f8rgsm\u00e5let for udviklere og IT-folk er ikke l\u00e6ngere hvilken model der er &#8220;klogest&#8221; p\u00e5 en leaderboard. Det er hvilken model der klarer det arbejde, du faktisk skal have gjort.<\/p>\n\n\n\n<p>Kort version: GPT-5.5 er designet til at t\u00e6nke, planl\u00e6gge og klikke over flere timer ad gangen. Opus 4.7 er den mere st\u00e5lsatte ingeni\u00f8r n\u00e5r det handler om at l\u00f8se rigtige bugs i en rigtig kodebase. Benchmarks bekr\u00e6fter vinklen fra begge lejre, og forskellen i output-pris p\u00e5 17 procent g\u00f8r valget mindre trivielt end det ser ud.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Benchmarks: to modeller, to forskellige styrker<\/h2>\n\n\n\n<p>Tallene er offentliggjort af begge leverand\u00f8rer og krydsbekr\u00e6ftet af Artificial Analysis og tredjeparts-bencheres. Her er de vigtigste:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Terminal-Bench 2.0<\/strong> (planl\u00e6gning og tool-brug i shellen): GPT-5.5 tager 82,7 procent. Opus 4.7 st\u00e5r p\u00e5 69,4. Forspringet er vokset fra 5,7 point under GPT-5.4 til hele 13,3 point nu.<\/li>\n<li><strong>SWE-Bench Pro<\/strong> (rigtige GitHub-issues): Opus 4.7 scorer 64,3 procent mod 58,6 for GPT-5.5. Det er Anthropics hjemmebane, og de f\u00f8rer med 5,7 point.<\/li>\n<li><strong>MCP-Atlas<\/strong> (orkestrering af MCP-servere): Opus 4.7 vinder knebent med 79,1 mod 75,3.<\/li>\n<li><strong>OSWorld-Verified<\/strong> (computer use i rigtige desktop-milj\u00f8er): 78,7 vs 78,0. Reelt uafgjort.<\/li>\n<li><strong>OpenAI MRCR v2<\/strong> p\u00e5 512K-1M tokens: GPT-5.5 retriever 74 procent korrekt. Opus 4.7 kollapser til 32,2. I de l\u00e6ngste kontekster er det ikke engang samme liga.<\/li>\n<li><strong>GDPval<\/strong> (OpenAIs egen \u00f8konomisk-v\u00e6rdi-test af 44 vidensarbejder-jobs): 84,9 mod 80,3.<\/li>\n<li><strong>FrontierMath Tier 4<\/strong>: GPT-5.5 rammer 35,4 procent, Opus 4.7 lander p\u00e5 22,9.<\/li>\n<li><strong>GPQA Diamond<\/strong> (videnskabelig r\u00e6sonnering): Opus 4.7 f\u00f8rer 94,2 mod 93,6. Statistisk st\u00f8j.<\/li>\n<\/ul>\n\n\n\n<p>Artificial Analysis&#8217; samlede Intelligence Index (xhigh) giver GPT-5.5 60 point, tre point over b\u00e5de Opus 4.7 og Gemini 3.1 Pro. Det er den f\u00f8rste gang OpenAI har ligget \u00f8verst p\u00e5 det index siden sent i 2025. Men indekset gemmer det faktum at Opus 4.7 har nogle meget konkrete vinkler hvor den sl\u00e5r igennem, is\u00e6r MCP-workflows og store refaktoreringer.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Hvad er &#8220;computer use&#8221; egentlig<\/h2>\n\n\n\n<p>OpenAIs salgsargument for GPT-5.5 er at den ikke bare skriver kode, den bruger computeren. Kombineret med Codex kan den se sk\u00e6rmen, klikke, skrive, navigere i UI&#8217;er og bev\u00e6ge sig mellem v\u00e6rkt\u00f8jer uden at du skal holde h\u00e5nden p\u00e5 hver eneste shift+enter. Det er samme retning som Anthropic har bev\u00e6get sig siden Claude 3.5 Sonnet fik computer use tilbage i oktober 2024, men OpenAI har ventet til benchmarks var p\u00e5 plads f\u00f8r de trykkede p\u00e5 udgivelsesknappen.<\/p>\n\n\n\n<p>Praktisk betyder det at GPT-5.5 kan k\u00f8re multi-step opgaver: \u00e5ben et regneark, hent data fra en hjemmeside, ryd op i kolonnerne, send rapporten som e-mail. Det lyder banalt indtil du pr\u00f8ver at f\u00e5 en model til at fastholde kontekst gennem 45 minutters navigation uden at glemme hvad den startede med. Den 74 procent score p\u00e5 1-million-token MRCR er faktisk afg\u00f8rende her. Opus 4.7 falder gennem gulvet ved de kontekst-dybder, og det er synligt i lange agent-traces.<\/p>\n\n\n\n<p>Til geng\u00e6ld: hvis dit agent-arbejde handler om at orkestrere MCP-servere, lave pr\u00e6cise code patches eller refaktorere en stor pull request, er Opus 4.7 stadig den model Cursor-brugere, JetBrains AI Assistant og store dele af Claude Code-\u00f8kosystemet v\u00e6lger. Den har ogs\u00e5 det vi kalder et produktions-track record: den har k\u00f8rt p\u00e5 tv\u00e6rs af AWS Bedrock, Google Vertex og Microsoft Foundry siden dag et, hvilket g\u00f8r enterprise-procurement mindre smertefuld. Jeg skrev mere om Opus 4.7&#8217;s styrker og begr\u00e6nsninger <a href=\"https:\/\/vittrup-graversen.dk\/index.php\/2026\/04\/16\/claude-opus-4-7-hvad-er-nyt-og-hvad-betyder-det-for-udviklere\/\">her<\/a>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Pris, tilg\u00e6ngelighed og det lange l\u00f8b<\/h2>\n\n\n\n<p>Begge modeller koster 5 dollar per million input-tokens. P\u00e5 output er der forskel: GPT-5.5 tager 30 dollar, Opus 4.7 tager 25. For agenter der producerer lange outputs (lange kode\u00e6ndringer, l\u00e6ngere rapporter, flere iterationer) l\u00f8ber det hurtigt op. Ved 17 procent prisforskel kan Anthropic faktisk argumentere for at Opus 4.7 er den billigere frontier-model n\u00e5r du regner en rigtig workload igennem. Omvendt: hvis du sparer to timer p\u00e5 en enkelt opgave fordi GPT-5.5 ikke mister tr\u00e5den i lange kontekster, er prissp\u00f8rgsm\u00e5let irrelevant.<\/p>\n\n\n\n<p>Distributionen er ogs\u00e5 v\u00e6rd at bide m\u00e6rke i. GPT-5.5 er rullet ud til Plus, Pro, Business og Enterprise med det samme, og API-adgang f\u00f8lger &#8220;soon&#8221; if\u00f8lge OpenAI. Det er hurtig penetration i ChatGPT-basen, men langsommere i enterprise-clouds. Opus 4.7 var tilg\u00e6ngelig p\u00e5 samtlige tre store hyperscalers fra dag et. I Europa betyder det noget: vi har stadig <a href=\"https:\/\/vittrup-graversen.dk\/index.php\/2026\/04\/17\/claude-mythos-og-eu-eksklusionen-afsloerer-et-strukturelt-problem-for-europaeisk-ai-suveraenitet\/\">en \u00e6gte problemstilling<\/a> omkring hvilke modeller EU-kunder m\u00e5 bruge uden regulatorisk hovedpine.<\/p>\n\n\n\n<p>Det er ogs\u00e5 v\u00e6rd at bem\u00e6rke at GPT-5.5 kommer kun uger efter GPT-5.4. OpenAI er \u00e5benlyst g\u00e5et fra &#8220;major version n\u00e5r det er klar&#8221; til l\u00f8bende inkrementel forbedring. Anthropic har gjort det samme (Opus 4.7 efter 4.6 efter 4.5 i halv\u00e5rligt tempo). For udviklere betyder det: planl\u00e6g integrationer med version-pinning, ellers st\u00e5r du med utilsigtede adf\u00e6rds\u00e6ndringer.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Hvad skal du faktisk v\u00e6lge<\/h2>\n\n\n\n<p>Simpel tommelfingerregel efter en uges test med begge:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>GPT-5.5<\/strong>: Command-line agenter, computer use, nye features fra scratch, lange research-sessions, multi-document r\u00e6sonnering. N\u00e5r opgaven kr\u00e6ver at modellen holder fokus gennem 40+ minutters arbejde.<\/li>\n<li><strong>Opus 4.7<\/strong>: St\u00f8rre refaktoreringer i eksisterende kodebaser, MCP-tungt agent-arbejde, code review, Cursor\/Claude Code-workflows, EU-compliance via hyperscalers. N\u00e5r opgaven er kirurgi i kode der findes i forvejen.<\/li>\n<\/ul>\n\n\n\n<p>Det pudsige er at ingen af de to har &#8220;vundet&#8221; i den forstand man f\u00f8r forestillede sig. De har specialiseret sig. GPT-5.5 er en generalist med fokus p\u00e5 action over tid, Opus 4.7 er en specialist i kode-sager. Hvis du kun har r\u00e5d til \u00e9n leverand\u00f8r-relation, er Opus 4.7 nok det sikreste valg i dag, fordi agenten stadig er afh\u00e6ngig af at kunne redigere eksisterende systemer. Hvis du kan have begge, s\u00e5 g\u00f8r det. Sendte du en tyk refaktor-opgave til GPT-5.5 i g\u00e5r, burde du sende den samme til Opus 4.7 i dag og sammenligne. Det er den eneste m\u00e5de at vide hvilken der passer til <em>din<\/em> kode.<\/p>\n\n\n\n<p>En sidste observation: OpenAI skrev selv om &#8220;a new class of intelligence&#8221; i deres annoncering, men til dobbelt API-pris for outputs i forhold til GPT-5.4. Den slags sprog skal man l\u00e6se kritisk. Modellerne er bedre. De er ikke en ny klasse. De er den samme transformer-arkitektur tr\u00e6net med bedre data, bedre RL og mere compute. Det interessante ligger i det praktiske: at OpenAI nu seri\u00f8st satser p\u00e5 agenten som produkt, og at Anthropic har svaret ved at g\u00f8re deres eksisterende agent-tooling endnu bedre. <a href=\"https:\/\/vittrup-graversen.dk\/index.php\/2026\/04\/21\/cursor-canvases-naar-ai-agenten-ikke-bare-svarer-men-bygger-sit-eget-arbejdsrum\/\">Hele branchen rykker i samme retning<\/a>, og udviklerne er dem der st\u00e5r tilbage med ansvaret for at holde styr p\u00e5 hvilken model der l\u00f8ser hvilken opgave bedst.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Kilder<\/h2>\n\n\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/openai.com\/index\/introducing-gpt-5-5\/\" target=\"_blank\" rel=\"noopener\">Introducing GPT-5.5<\/a> &#8211; OpenAI, 23. april 2026<\/li>\n<li><a href=\"https:\/\/www.marktechpost.com\/2026\/04\/23\/openai-releases-gpt-5-5-a-fully-retrained-agentic-model-that-scores-82-7-on-terminal-bench-2-0-and-84-9-on-gdpval\/\" target=\"_blank\" rel=\"noopener\">OpenAI Releases GPT-5.5, a Fully Retrained Agentic Model<\/a> &#8211; MarkTechPost, 23. april 2026<\/li>\n<li><a href=\"https:\/\/techcrunch.com\/2026\/04\/23\/openai-chatgpt-gpt-5-5-ai-model-superapp\/\" target=\"_blank\" rel=\"noopener\">OpenAI releases GPT-5.5, bringing company one step closer to an AI &#8216;super app&#8217;<\/a> &#8211; TechCrunch, 23. april 2026<\/li>\n<li><a href=\"https:\/\/www.digitalapplied.com\/blog\/gpt-5-5-vs-claude-opus-4-7-frontier-comparison\" target=\"_blank\" rel=\"noopener\">GPT-5.5 vs Claude Opus 4.7: Benchmarks &amp; Pricing<\/a> &#8211; Digital Applied<\/li>\n<li><a href=\"https:\/\/the-decoder.com\/openai-unveils-gpt-5-5-claims-a-new-class-of-intelligence-at-double-the-api-price\/\" target=\"_blank\" rel=\"noopener\">OpenAI unveils GPT-5.5, claims a &#8220;new class of intelligence&#8221; at double the API price<\/a> &#8211; The Decoder<\/li>\n<li><a href=\"https:\/\/www.theneuron.ai\/explainer-articles\/-openai-launched-gpt-55-and-its-built-to-run-your-computer\/\" target=\"_blank\" rel=\"noopener\">OpenAI launched GPT-5.5 and it&#8217;s built to run your computer<\/a> &#8211; The Neuron<\/li>\n<\/ul>\n\n","protected":false},"excerpt":{"rendered":"<p>GPT-5.5 vs Opus 4.7: Benchmarks, pris og styrker sammenlignet. Kort kamp om agentisk kodning, lang kontekst og computer use.<\/p>\n","protected":false},"author":1,"featured_media":1295,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[24,8],"tags":[34,23,31,35],"class_list":["post-1296","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-agentic-engineering","category-ai","tag-anthropic","tag-claudecode","tag-language-models","tag-openai"],"acf":[],"_links":{"self":[{"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/posts\/1296","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/comments?post=1296"}],"version-history":[{"count":1,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/posts\/1296\/revisions"}],"predecessor-version":[{"id":1297,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/posts\/1296\/revisions\/1297"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/media\/1295"}],"wp:attachment":[{"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/media?parent=1296"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/categories?post=1296"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/tags?post=1296"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}