Gemini 3.5 Flash: Google satser alt på agenter - ikke chatbots

Google udgav den 19. maj Gemini 3.5 Flash – en model der på overfladen ligner endnu en inkrementel Flash-opdatering, men som i praksis repræsenterer et klart strategiskifte. For første gang er en frontier-klasse model primært designet til agentiske workflows og tool use – ikke til chatbot-samtaler. Tallene understøtter positioneringen.

Bygget til agenter fra grunden

Gemini 3.5 Flash scorer 83,6% på MCP Atlas-benchmarken for multi-step tool orchestration – foran Model Context Protocol er nu en etableret standard, og Flash er den første frontier-model der er optimeret direkte til den. Sammenlignet med Claude Opus 4.7 (79,1%) og GPT-5.5 (75,3%) på samme benchmark er det et klart forspring. På Toolathlon, der tester præcis tool calling, er Gemini 3.5 Flash nummer et med 56,5%.

Hastigheden er central for den agentiske use case. Modellen kører ~289 tokens/sekund – ca. 4x hurtigere end sammenlignelige frontier-modeller. Det gør iterative agent-loops praktisk mulige i realtid på en måde, der var upraktisk ved Pro-tiers latens. Teknisk set understøtter den dynamisk tænkning med justerbar thinking_level (low/medium/high), native function calling, parallel subagent-kørsel og struktureret output som first-class funktioner.

Google demonstrerede ved lanceringen 93 parallelle subagenter kørt via Antigravity-platformen – 15.000+ requests under 1.000 dollar over 12 timer. Xero bruger modellen til flersporede skatteprocesser der løber over uger. Shopify til parallel merchant-forecasting. Macquarie Bank til analyse af 100+ siders finansielle dokumenter. Det er ikke chatbot-use cases – det er produktionsagenter.

Hvad den ikke er god til

Trade-offs er reelle og bør ikke undervurderes. På Humanity’s Last Exam scorer Gemini 3.5 Flash 40,2% mod Gemini 3.1 Pros 44,4%. ARC-AGI-2: 72,1% mod 77,1%. Lang-kontekst retrieval (MRCR v2 128k): 77,3% mod 84,9%. SWE-Bench Pro for kompleks kodning: 55,1% mod Claude Opus 4.7’s 64,3%.

Google har optimeret til orchestration og tool use på bekostning af tung ræsonnering. For IT-folk og arkitekter er konklusionen klar: brug Flash til koordination og API-kald, ikke til videnskabelig analyse eller kompleks dokumentforståelse. Computer use-funktionalitet er heller ikke tilgængelig – GPT-5.5 scorer 75%+ på OS-automatisering; Gemini 3.5 Flash har slet ikke den kapabilitet endnu.

Prisstigningen er markant

Input koster nu $1,50/1M tokens og output $9/1M. Det er 3x dyrere end Flash Preview ($0,50/$3,00) og 6x dyrere end Flash-Lite ($0,25/$1,50). Sammenlignet med Claude Opus 4.7 ($15/$75) og GPT-5.5 ($10/$30) er Gemini 3.5 Flash stadig det billigste frontier-alternativ – men outputprisen er høj nok til at agentic workflows med mange tokens hurtigt løber op.

Simon Willison formulerede det direkte: “Alle tre store AI-labs ser ud til at sonde prisfølsomheden hos deres API-kunder.” Det passer ind i et bredere billede – se hvordan LLM-priser udviklede sig i april 2026, og det er tydeligt at den kortvarige priskonkurrence nu vender.

Der er et praktisk gotcha at have in mente: porterer man fra gemini-3-flash-preview uden at sætte thinking_level eksplicit, falder den stiltiende fra “high” til “medium”. Ingen advarsel, mærkbar kvalitetsforringelse. Herudover er modellen verbose – den genererer gennemsnitligt ~73 millioner output-tokens på benchmark-kørsel mod et gennemsnit på 36 millioner. I produktion kan det betyde dobbelt så høj outputpris som man regner med.

Googles strategi: agenter er platformen

Det interessante ved Gemini 3.5 Flash er ikke modellen isoleret set – det er hvad den signalerer om Googles retning. Mens Googles Remy-agent er den forbrugervendte manifestation af strategien, er Gemini 3.5 Flash det API-lag som enterprise og udviklere bygger på. Google positionerer ikke Flash som en billig chatbot-model – de positionerer den som det primære orkestreringslag i en multi-agent arkitektur.

Gemini 3.5 Pro er annonceret til juni 2026 og vil formentlig lukke gabet på ræsonnements-benchmarks. Frem til da er mønsteret klart: Flash til orchestration og tool use, Pro til de kognitivt tunge subtasks. Det er et rimeligt arkitekturmønster – og et der giver Google et konkurrencedygtigt tilbud til enterprise-kunder der bygger agentiske systemer i produktion.

TechCrunch’s overskrift “Google bets its next AI wave on agents, not chatbots” er præcis. Gemini 3.5 Flash er den konkrete implementering af det væddemål.