Google lancerer Gemini 3.1 Pro med dobbelt så stærk logisk ræsonnering

Google har netop frigivet Gemini 3.1 Pro — en markant opgradering af deres kernemodel i Gemini 3-serien. Opdateringen lander blot tre måneder efter Gemini 3 Pro og signalerer, at kapløbet om den mest intelligente AI-model langt fra er overstået.

Hvad er nyt?

Den mest iøjnefaldende forbedring er modellens evne til logisk ræsonnering. På ARC-AGI-2 — et benchmark der måler evnen til at løse helt nye logiske mønstre — scorer Gemini 3.1 Pro 77,1%. Det er mere end det dobbelte af forgængeren Gemini 3 Pro, som landede på 31,1%.

For at sætte det i perspektiv: ARC-AGI-2 er designet til at teste om en model faktisk kan tænke over nye problemer, i modsætning til blot at genkende mønstre fra træningsdata. En fordobling på dette benchmark er exceptionelt.

Nøgletal fra benchmarks

Her er de vigtigste resultater sammenlignet med konkurrenterne:

ARC-AGI-2 (logisk ræsonnering): 77,1% — langt foran GPT-5.2 og Claude Opus 4.6
Humanity’s Last Exam (ræsonnering nær menneskeligt niveau): 44,7% mod Claude Opus 4.6’s 40,0% og GPT-5.2’s 34,5%
GPQA Diamond (videnskabelig ræsonnering på ph.d.-niveau): 94,1%
Terminal-Bench Hard (agentbaseret kodning): 53,8%
SciCode (videnskabelig Python-programmering): 58,9%

Relevant for udviklere: kontekst og værktøjer

Ud over ræsonneringsevnerne byder 3.1 Pro på flere tekniske forbedringer, der gør den interessant for udviklere:

1 million tokens kontekstvindue (input) — nok til at fodre modellen med et helt koderepository
65.000 tokens output — en markant forøgelse der gør det muligt at generere længere, sammenhængende kode og dokumentation i ét kald
Filupload op til 100 MB (tidligere 20 MB) og direkte YouTube-URL-support
En ny customtools-endpoint optimeret til agentbaserede workflows, hvor modellen er bedre til at vælge det rigtige værktøj (f.eks. lokal fillæsning fremfor en websøgning)
Integration med Google Antigravity, Googles nye agentplatform, med justerbart “tænkebudget” (lav/medium/høj) for at balancere latens og pris

Én lille breaking change

Bemærk at feltet total_reasoning_tokens er omdøbt til total_thought_tokens i Interactions API v1beta. Det er en lille men vigtig ændring for alle der bygger på Gemini-API’et.

Hvor kan du prøve det?

Gemini 3.1 Pro er tilgængeligt allerede nu i preview via:

Gemini-appen (gratis brugere har adgang, betalende brugere får højere forbrugsgrænser)
Google AI Studio og Vertex AI (for udviklere)
Gemini CLI og Android Studio
NotebookLM (kun for Pro- og Ultra-abonnenter)

Perspektiv

Lanceringen af Gemini 3.1 Pro understreger det tempo, AI-kapløbet kører i. Da Gemini 3 Pro blev lanceret i november, fik det angiveligt OpenAI’s Sam Altman til at erklære code red internt. Med 3.1 Pro’s imponerende resultater på ræsonneringsbenchmarks — og især den agentbaserede retning med customtools og Antigravity — strammer Google grebet yderligere.

For udviklere og AI-interesserede er budskabet klart: vi bevæger os fra modeller der chatter til modeller der arbejder. Og det tempo accelererer.

Denne artikel er skrevet i samarbejde med AI, og efterfølgende redigeret af et rigtigt menneske 🙂