Google har netop frigivet Gemini 3.1 Pro — en markant opgradering af deres kernemodel i Gemini 3-serien. Opdateringen lander blot tre måneder efter Gemini 3 Pro og signalerer, at kapløbet om den mest intelligente AI-model langt fra er overstået.
Hvad er nyt?
Den mest iøjnefaldende forbedring er modellens evne til logisk ræsonnering. På ARC-AGI-2 — et benchmark der måler evnen til at løse helt nye logiske mønstre — scorer Gemini 3.1 Pro 77,1%. Det er mere end det dobbelte af forgængeren Gemini 3 Pro, som landede på 31,1%.
For at sætte det i perspektiv: ARC-AGI-2 er designet til at teste om en model faktisk kan tænke over nye problemer, i modsætning til blot at genkende mønstre fra træningsdata. En fordobling på dette benchmark er exceptionelt.
Nøgletal fra benchmarks
Her er de vigtigste resultater sammenlignet med konkurrenterne:
- ARC-AGI-2 (logisk ræsonnering): 77,1% — langt foran GPT-5.2 og Claude Opus 4.6
- Humanity’s Last Exam (ræsonnering nær menneskeligt niveau): 44,7% mod Claude Opus 4.6’s 40,0% og GPT-5.2’s 34,5%
- GPQA Diamond (videnskabelig ræsonnering på ph.d.-niveau): 94,1%
- Terminal-Bench Hard (agentbaseret kodning): 53,8%
- SciCode (videnskabelig Python-programmering): 58,9%
Relevant for udviklere: kontekst og værktøjer
Ud over ræsonneringsevnerne byder 3.1 Pro på flere tekniske forbedringer, der gør den interessant for udviklere:
- 1 million tokens kontekstvindue (input) — nok til at fodre modellen med et helt koderepository
- 65.000 tokens output — en markant forøgelse der gør det muligt at generere længere, sammenhængende kode og dokumentation i ét kald
- Filupload op til 100 MB (tidligere 20 MB) og direkte YouTube-URL-support
- En ny
customtools-endpoint optimeret til agentbaserede workflows, hvor modellen er bedre til at vælge det rigtige værktøj (f.eks. lokal fillæsning fremfor en websøgning) - Integration med Google Antigravity, Googles nye agentplatform, med justerbart “tænkebudget” (lav/medium/høj) for at balancere latens og pris
Én lille breaking change
Bemærk at feltet total_reasoning_tokens er omdøbt til total_thought_tokens i Interactions API v1beta. Det er en lille men vigtig ændring for alle der bygger på Gemini-API’et.
Hvor kan du prøve det?
Gemini 3.1 Pro er tilgængeligt allerede nu i preview via:
- Gemini-appen (gratis brugere har adgang, betalende brugere får højere forbrugsgrænser)
- Google AI Studio og Vertex AI (for udviklere)
- Gemini CLI og Android Studio
- NotebookLM (kun for Pro- og Ultra-abonnenter)
Perspektiv
Lanceringen af Gemini 3.1 Pro understreger det tempo, AI-kapløbet kører i. Da Gemini 3 Pro blev lanceret i november, fik det angiveligt OpenAI’s Sam Altman til at erklære code red internt. Med 3.1 Pro’s imponerende resultater på ræsonneringsbenchmarks — og især den agentbaserede retning med customtools og Antigravity — strammer Google grebet yderligere.
For udviklere og AI-interesserede er budskabet klart: vi bevæger os fra modeller der chatter til modeller der arbejder. Og det tempo accelererer.
Denne artikel er skrevet i samarbejde med AI, og efterfølgende redigeret af et rigtigt menneske 🙂