Gemini 3.5 Pro: Google lover 2 millioner tokens og Deep Think - men holder de fristen?

Den 19. maj stod Google-chef Sundar Pichai på scenen ved Google I/O og sagde noget usædvanligt konkret om deres kommende flagskibsmodel: “Give us until next month.” Det var en offentlig forpligtelse til at levere Gemini 3.5 Pro i juni 2026 – og nu er vi midt i den måned. Spørgsmålet er, om Google holder fristen, og hvad vi præcist kan forvente.

Gemini 3.5 Flash er allerede ude – den kom til general availability den 19. maj. Den er fire gange hurtigere end sammenlignelige frontiermodeller, holder 76,2% på Terminal-Bench 2.1 og slår Gemini 3.1 Pro på kodning og agentopgaver. Men Flash er designet til hastighed og skalerbarhed, ikke til de tungeste ræsonnementopgaver. Det er her Pro skal ind.

Hvad Flash-resultater fortæller os om Pro

For at forstå Gemini 3.5 Pro er det nyttigt at se, hvad Flash bevidst lod ligge. Flash regrederede 4-8 point på ræsonnementbenchmarks – Humanity’s Last Exam, ARC-AGI-2 og langt kontekst-recall ved over 128.000 tokens – sammenlignet med Gemini 3.1 Pro. Det er ikke en fejl, det er et designvalg: Flash er optimeret til agenter og kodning, ikke til dybe analytiske opgaver.

Pro’s eksistensberettigelse er netop at genetablere det ræsonnement- og langt-kontekst-forspring, som Flash ofrede. Ifølge analyser fra WaveSpeed AI peger alle signaler på, at Pro vil adressere de præcise benchmarks, Flash tabte på.

Hvad Google har bekræftet – og hvad der stadig er rygter

Google har officielt bekræftet meget lidt om Gemini 3.5 Pro ud over den overordnede ambition. Sundar Pichai nævnte “frontier multimodal understanding” og Deep Think-tilstand, og selskabet har antydet et kontekstvindue på op til 2 millioner tokens – det dobbelte af Flash’s 1 million.

Det er et markant hop. Et 2-millioner-tokens kontekstvindue svarer til at holde en hel roman, en stor kodebase og et halvt års emails i arbejdshukommelsen på én gang. Til sammenligning sidder MiniMax M3 med 1 million tokens som sit store konkurrencepunkt – og det er allerede imponerende nok.

Deep Think-tilstanden er Googles svar på “extended thinking”-funktioner hos Anthropic og OpenAI. I praksis betyder det, at modellen bruger mere beregningstid på at ræsonnere igennem komplekse problemer, inden den svarer. Det passer til Pro’s positionering som det tunge alternativ til det hurtige Flash.

Det er dog værd at bemærke, at Google ikke har offentliggjort specifikke benchmark-tal for Pro endnu. Alle forventninger bygger på Flash’s kendte svagheder og Googles vage løfter – ikke på målte resultater.

Prisen: Googles stærkeste konkurrencevåben

Her er det interessante: Google forventes at prissætte Gemini 3.5 Pro markant under de nærmeste konkurrenter. Markedsanalytikere peger på en forventet API-pris på ca. $3,00 per million input-tokens og $18,00 per million output-tokens.

Til sammenligning koster GPT-5.5 fra OpenAI ca. $5/$30, og Claude Opus 4.7 fra Anthropic koster $5/$25. Hvis Google leverer frontierklasse-ræsonnement til 40% under konkurrenterne, er det et reelt prispres på hele segmentet.

Flash satte allerede en ny standard: $1,50/$9 – tre gange dyrere end den tidligere Flash-model, men stadig billigere end konkurrenternes Pro-tilbud. Google kan med andre ord tilbyde et komplet spænd fra budget til frontier, og de bruger bevidst prisen som differentieringsstrategi.

Hvem får adgang – og hvornår?

Planen ser ud til at følge Google’s sædvanlige udrulningsmodel. Pro kommer først til Gemini Ultra-abonnenter ($250 pr. måned) – de får også adgang til Deep Think-tilstanden. Gemini Pro-abonnenter ($20 pr. måned) får modellen uden Deep Think. Bredere API-adgang via Google AI Studio og Vertex AI følger bagefter.

Gemini 3.5 Pro er i intern brug hos Google og i et begrænset preview på Vertex AI. Det indikerer, at modellen teknisk set er klar, og at ventetiden handler om infrastruktur og udrulningskapacitet – ikke om yderligere træning.

Bedste bud på lanceringsdato er den sidste fulde uge af juni, altså 22.-26. juni 2026. Men Google har ikke bekræftet en specifik dato, og markedsanalytikere er splittede om, hvorvidt Pro faktisk ryger ud inden månedens udgang.

Hvad det betyder i den bredere konkurrence

Frontiermarkedet er i dag delt i to funktionelle lag. Det hurtige, billige lag – Flash, GPT-5.5 Instant, Claude Sonnet – håndterer volumenopgaver og agentic workflows. Det tunge lag – Pro-modeller og Opus – er til de opgaver, der kræver dybe ræsonnementskæder og store kontekster.

Google er stærke i begge lag med Flash allerede ude. Med Gemini 3.5 Pro forsøger de at kile sig ind på prisniveauet under GPT-5.5 og Claude, men med sammenlignelig ydeevne. Det er en velovervejet strategi, men den afhænger af, at benchmarks rent faktisk lever op til forventningerne.

Google har vist tidligere, at de kan levere imponerende Flash-resultater – se f.eks. Gemma 4 12B’s encoder-fri arkitektur, der demonstrerer, at Google er villige til at eksperimentere arkitektonisk. Spørgsmålet er, om Pro-modellen kan bekræfte det i åbne benchmarks, eller om løfterne forbliver vage.

For udviklere og IT-arkitekter: Gemini 3.5 Flash er allerede et stærkt valg til agentworkflows og kodningspipelines. Hvis Pro leverer 2M-token kontekst og Deep Think til den forventede pris, bliver det et reelt alternativ til de dyre frontier-flagskibe fra OpenAI og Anthropic. Vent på de officielle benchmark-tal inden du re-arkitekterer noget.