Google lancerer Gemini 3.1 Pro med dobbelt så stærk logisk ræsonnering

1 min read

Google har netop frigivet Gemini 3.1 Pro — en markant opgradering af deres kernemodel i Gemini 3-serien. Opdateringen lander blot tre måneder efter Gemini 3 Pro og signalerer, at kapløbet om den mest intelligente AI-model langt fra er overstået.

Hvad er nyt?

Den mest iøjnefaldende forbedring er modellens evne til logisk ræsonnering. På ARC-AGI-2 — et benchmark der måler evnen til at løse helt nye logiske mønstre — scorer Gemini 3.1 Pro 77,1%. Det er mere end det dobbelte af forgængeren Gemini 3 Pro, som landede på 31,1%.

For at sætte det i perspektiv: ARC-AGI-2 er designet til at teste om en model faktisk kan tænke over nye problemer, i modsætning til blot at genkende mønstre fra træningsdata. En fordobling på dette benchmark er exceptionelt.

Nøgletal fra benchmarks

Her er de vigtigste resultater sammenlignet med konkurrenterne:

  • ARC-AGI-2 (logisk ræsonnering): 77,1% — langt foran GPT-5.2 og Claude Opus 4.6
  • Humanity’s Last Exam (ræsonnering nær menneskeligt niveau): 44,7% mod Claude Opus 4.6’s 40,0% og GPT-5.2’s 34,5%
  • GPQA Diamond (videnskabelig ræsonnering på ph.d.-niveau): 94,1%
  • Terminal-Bench Hard (agentbaseret kodning): 53,8%
  • SciCode (videnskabelig Python-programmering): 58,9%

Relevant for udviklere: kontekst og værktøjer

Ud over ræsonneringsevnerne byder 3.1 Pro på flere tekniske forbedringer, der gør den interessant for udviklere:

  • 1 million tokens kontekstvindue (input) — nok til at fodre modellen med et helt koderepository
  • 65.000 tokens output — en markant forøgelse der gør det muligt at generere længere, sammenhængende kode og dokumentation i ét kald
  • Filupload op til 100 MB (tidligere 20 MB) og direkte YouTube-URL-support
  • En ny customtools-endpoint optimeret til agentbaserede workflows, hvor modellen er bedre til at vælge det rigtige værktøj (f.eks. lokal fillæsning fremfor en websøgning)
  • Integration med Google Antigravity, Googles nye agentplatform, med justerbart “tænkebudget” (lav/medium/høj) for at balancere latens og pris

Én lille breaking change

Bemærk at feltet total_reasoning_tokens er omdøbt til total_thought_tokens i Interactions API v1beta. Det er en lille men vigtig ændring for alle der bygger på Gemini-API’et.

Hvor kan du prøve det?

Gemini 3.1 Pro er tilgængeligt allerede nu i preview via:

  • Gemini-appen (gratis brugere har adgang, betalende brugere får højere forbrugsgrænser)
  • Google AI Studio og Vertex AI (for udviklere)
  • Gemini CLI og Android Studio
  • NotebookLM (kun for Pro- og Ultra-abonnenter)

Perspektiv

Lanceringen af Gemini 3.1 Pro understreger det tempo, AI-kapløbet kører i. Da Gemini 3 Pro blev lanceret i november, fik det angiveligt OpenAI’s Sam Altman til at erklære code red internt. Med 3.1 Pro’s imponerende resultater på ræsonneringsbenchmarks — og især den agentbaserede retning med customtools og Antigravity — strammer Google grebet yderligere.

For udviklere og AI-interesserede er budskabet klart: vi bevæger os fra modeller der chatter til modeller der arbejder. Og det tempo accelererer.


Denne artikel er skrevet i samarbejde med AI, og efterfølgende redigeret af et rigtigt menneske 🙂

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *