Mistral Medium 3.5: Europæisk 128B-model tager kampen op mod GPT-5.5 med async kodningsagenter

Mistral AI lancerede den 29. april 2026 deres hidtil kraftigste model, Mistral Medium 3.5 – en tæt 128B-parametersmodel der ikke benytter Mixture-of-Experts, men aktiverer alle 128 milliarder parametre på hvert token. Det er et bevidst valg: konsistens og forudsigelighed frem for rå effektivitet.

Modellen kommer med et kontekstvindue på 262.144 tokens (256K) og slår på benchmarks som Anthropics og OpenAIs seneste modeller på specifikke kodningsopgaver. Men det er ikke kun modellen selv, der er interessant – det er den medfølgende Vibe-platform og understøttelse af asynkrone kodningsagenter, der giver Mistral et nyt bud på, hvad europæisk AI kan stille op.

Tallene bag Mistral Medium 3.5

På SWE-Bench Verified – den anerkendte benchmark for software engineering – scorer Mistral Medium 3.5 77,6 procent. Det slår konkurrenterne Devstral 2 og Qwen3.5 397B A17B og ligger på niveau med de bedste lukkede modeller. På Tau3-Telecom agentic benchmark rammer modellen 91,4 procent.

Til sammenligning: GPT-5.5 Instant er OpenAIs nuværende standardmodel, men scorer lavere på SWE-Bench. DeepSeek V4 med sin MoE-arkitektur på 1,6 billioner parametre rammer 80,6 procent – men kræver massiv infrastruktur at køre selv. Mistral Medium 3.5 positionerer sig som den effektive midte: højtydende, relativt kompakt og med en klar europæisk provenienstransparens.

Vibe og asynkrone agenter: Kodning uden babysitting

Det teknisk mest interessante ved lanceringen er integrationen med Vibe – Mistrals agentic coding-platform. I den nye version kan du stille en opgave fra Le Chat, og en remote agent løser den asynkront i Mistrals cloud. Du behøver ikke sidde og overvåge processen. Agenten returnerer et PR-klart diff.

Det er et direkte svar på det, GitHub Copilot og Cursor har gjort populært, men med en afgørende forskel: opgaven lever i skyen, og flere agenter kan køre parallelt. For udviklere der jonglerer med mange features på én gang, er det en reel tidsbesparelse – ikke bare endnu et autofuldførelses-trick.

Sammenlign det med den retning Anthropic bevæger sig med agentic memory-konsolidering: Claude-agenter der konsoliderer viden mens de “sover”. Begge tilgange peger på det samme: AI-agenter bevæger sig fra reaktive hjælpere til systemer der håndterer opgaver uden konstant menneskelig overvågning.

Priskritik og det åbne alternativ

Mistrals prissætning er ikke gået upåagtet hen. Mistral Medium 3.5 koster 1,50 dollar per million input-tokens og 7,50 dollar per million output-tokens. Kritikere peger på, at Alibabas Qwen 3.6 på 27B parametre (Apache 2.0, gratis at selvhoste) rammer 72,4 procent på SWE-Bench til en brøkdel af prisen.

Det er et legitimt spørgsmål: betaler du for de ekstra 5 procentpoint på SWE-Bench, eller betaler du for Mistrals europæiske infrastruktur, databehandlingsgarantier og GDPR-compliance? For virksomheder der opererer under EU-regulering, er svaret måske åbenlyst. For en solo-udvikler i USA er det knap så givet.

Mistral er i øvrigt transparent om modellens vægte: Mistral Medium 3.5 er tilgængeligt på HuggingFace, hvilket giver mulighed for selvhosting for dem med infrastrukturen til det. Det adskiller dem fra OpenAI og Anthropic, der begge holder kortene tæt til brystet.

Hvad det betyder for europæisk AI

Mistral er fortsat det eneste europæiske AI-selskab der reelt konkurrerer i den absolutte top. Med Mistral Medium 3.5 bekræfter de, at det er muligt at levere frontier-niveau ydeevne med europæisk datasuverænitet som et eksplicit salgsargument.

Det er ikke en lille ting. Stanford AI Index 2026 dokumenterede netop, at USA og Kina dominerer AI-udviklingen globalt – og at gennemsigtighed og ansvarlighed halter bagud. En stærk europæisk spiller med åbne vægte og klare governance-principper er præcis det modvægtspunkt, der mangler.

For udviklere og IT-arkitekter i Europa er Mistral Medium 3.5 en model der er værd at evaluere seriøst. Ikke fordi den er billigst, men fordi den leverer konkurrencedygtig ydeevne indenfor en ramme der er juridisk og datamæssigt tryg at bruge i europæiske produktionssystemer.