{"id":743,"date":"2026-03-05T17:17:48","date_gmt":"2026-03-05T15:17:48","guid":{"rendered":"https:\/\/vittrup-graversen.dk\/?p=743"},"modified":"2026-03-28T12:10:29","modified_gmt":"2026-03-28T10:10:29","slug":"google-lancerer-gemini-3-1-flash-lite-otte-gange-billigere-end-pro-og-45-hurtigere","status":"publish","type":"post","link":"https:\/\/vittrup-graversen.dk\/index.php\/2026\/03\/05\/google-lancerer-gemini-3-1-flash-lite-otte-gange-billigere-end-pro-og-45-hurtigere\/","title":{"rendered":"Google lancerer Gemini 3.1 Flash-Lite \u2014 otte gange billigere end Pro og 45% hurtigere"},"content":{"rendered":"\n<p>Google har netop lanceret Gemini 3.1 Flash-Lite, den billigste og hurtigste model i Gemini 3-familien. Med en pris p\u00e5 $0,25 per million input-tokens og $1,50 per million output-tokens koster den en ottendedel af storebror Gemini 3.1 Pro \u2014 og den er samtidig markant hurtigere end forg\u00e6ngeren Gemini 2.5 Flash.<\/p>\n\n\n\n<p>For udviklere og virksomheder, der arbejder med AI i stor skala, er budskabet klart: Googles nyeste model er designet til at g\u00f8re AI-inferens s\u00e5 billigt og hurtigt, at det kan integreres i n\u00e6sten alt \u2014 fra kundeservice til realtids-indholdsmoderering.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Hastighed som konkurrenceparameter<\/h2>\n\n\n\n<p>I AI-verdenen handler det ikke kun om, hvor klogt et svar er \u2014 det handler om, hvor hurtigt det kommer. Gemini 3.1 Flash-Lite er bygget specifikt til at minimere ventetiden. If\u00f8lge Googles egne benchmarks er modellens <em>time to first token<\/em> 2,5 gange kortere end Gemini 2.5 Flash, mens den samlede output-hastighed er 45% h\u00f8jere med 363 tokens per sekund mod 249.<\/p>\n\n\n\n<p>Det lyder m\u00e5ske teknisk, men konsekvensen er konkret: N\u00e5r en chatbot eller et AI-assisteret interface f\u00f8les \u00f8jeblikkeligt, \u00e6ndrer det brugeroplevelsen fundamentalt. Som Koray Kavukcuoglu, VP of Research hos Google DeepMind, <a href=\"https:\/\/x.com\/koraykv\/status\/2028876506081194009\">beskrev det p\u00e5 X<\/a>: Der ligger &#8220;en utrolig m\u00e6ngde kompleks engineering&#8221; bag at f\u00e5 AI til at f\u00f8les \u00f8jeblikkelig.<\/p>\n\n\n\n<p>En af de mest interessante nye funktioner er <strong>thinking levels<\/strong> \u2014 muligheden for dynamisk at justere modellens r\u00e6sonneringsdybde. Til simple klassificeringsopgaver kan man skrue ned for at spare tid og penge. Til kompleks kodegenerering eller dashboard-opbygning kan man skrue op og lade modellen t\u00e6nke dybere, f\u00f8r den svarer. Det er en pragmatisk tilgang, der giver udviklere finkornet kontrol over forholdet mellem kvalitet, hastighed og omkostning.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Benchmarks: Lille model, store resultater<\/h2>\n\n\n\n<p>Trods sit &#8220;Lite&#8221;-suffix viser Gemini 3.1 Flash-Lite overraskende st\u00e6rke benchmark-resultater. Modellen opn\u00e5ede topplaceringer i 6 ud af 11 tests, hvor den slog b\u00e5de OpenAIs GPT-5 mini og Anthropics Claude 4.5 Haiku i flere kategorier. Her er nogle af n\u00f8gletallene:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>GPQA Diamond<\/strong> (videnskabelig viden p\u00e5 ph.d.-niveau): 86,9%<\/li>\n<li><strong>MMMU-Pro<\/strong> (multimodal forst\u00e5else): 76,8%<\/li>\n<li><strong>MMMLU<\/strong> (flersproget sp\u00f8rgsm\u00e5l-svar): 88,9%<\/li>\n<li><strong>LiveCodeBench<\/strong> (kodegenerering): 72,0%<\/li>\n<li><strong>Humanity&#8217;s Last Exam<\/strong> (abstrakt r\u00e6sonnering): 16,0% \u2014 til sammenligning scorer Gemini 3.1 Pro 44,4%<\/li>\n<\/ul>\n\n\n\n<p>Modellen scorer ogs\u00e5 1432 p\u00e5 <a href=\"https:\/\/lmarena.ai\/\" target=\"_blank\" rel=\"noopener\">Arena.ai Leaderboard<\/a> (Elo-rating), hvilket placerer den i konkurrencedygtigt selskab med langt st\u00f8rre modeller. S\u00e6rligt imponerende er dens evne til at generere struktureret output \u2014 valid JSON, SQL og UI-kode \u2014 som er afg\u00f8rende for enterprise-udviklere, der har brug for p\u00e5lideligt maskinl\u00e6sbart output.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Priskrigen intensiveres<\/h2>\n\n\n\n<p>Flash-Lite er Googles svar p\u00e5 en branche, der bev\u00e6ger sig mod stadig billigere AI-inferens. <a href=\"https:\/\/vittrup-graversen.dk\/index.php\/2026\/03\/04\/llm-modeller-doer-hurtigere-end-nogensinde-og-det-aendrer-spillereglerne\/\">Som vi tidligere har skrevet om<\/a>, falder priserne p\u00e5 LLM-inferens dramatisk, og det accelererer kun. Med Flash-Lite til $0,25\/$1,50 per million tokens (input\/output) underbydes selv Anthropics Claude 4.5 Haiku og OpenAIs GPT-5 mini, der begge ligger h\u00f8jere i prissegmentet.<\/p>\n\n\n\n<p>Strategien er tydelig: Google vil eje det segment, hvor virksomheder k\u00f8rer millioner af API-kald dagligt \u2014 overs\u00e6ttelse af produktbeskrivelser, moderering af indhold, klassificering af supporthenvendelser. Det er opgaver, der ikke kr\u00e6ver dyb r\u00e6sonnering, men hvor hastighed og pris er alt.<\/p>\n\n\n\n<p>Samtidig lancerede OpenAI i denne uge <a href=\"https:\/\/openai.com\/index\/gpt-5-3-instant\/\" target=\"_blank\" rel=\"noopener\">GPT-5.3 Instant<\/a>, der fokuserer p\u00e5 hurtigere samtaleflow og bedre webs\u00f8gning. Priskapl\u00f8bet i AI-branchen er ikke l\u00e6ngere kun et sp\u00f8rgsm\u00e5l om, hvem der har den klogeste model \u2014 det handler i stigende grad om, hvem der kan levere &#8220;god nok&#8221; AI til den laveste pris.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Hvad betyder det i praksis?<\/h2>\n\n\n\n<p>For danske udviklere og IT-afdelinger er Gemini 3.1 Flash-Lite interessant af flere grunde. Modellen er tilg\u00e6ngelig via Google Cloud Vertex AI og <a href=\"https:\/\/aistudio.google.com\/\" target=\"_blank\" rel=\"noopener\">Google AI Studio<\/a>, og den underst\u00f8tter multimodale prompts med op til 1 million tokens input og 64.000 tokens output \u2014 nok til at behandle lange dokumenter, billeder og video i samme kald.<\/p>\n\n\n\n<p>De oplagte use cases er dem, <a href=\"https:\/\/vittrup-graversen.dk\/index.php\/2026\/03\/05\/fra-vibe-coding-til-agentic-engineering-karpathys-nye-begreb-aendrer-spillets-regler\/\">hvor AI-agenter udf\u00f8rer repetitive opgaver<\/a> i stor skala: automatisk tagging af indhold, realtids-overs\u00e6ttelse, compliance-screening eller generering af dashboards fra naturligt sprog. Med thinking levels kan man balancere mellem &#8220;hurtig og billig&#8221; og &#8220;grundig og dyrere&#8221; inden for samme model.<\/p>\n\n\n\n<p>Flash-Lite er i preview nu og forventes at blive generelt tilg\u00e6ngelig i l\u00f8bet af de kommende uger. Om den lever op til benchmarks i virkelighedens rod og st\u00f8j, vil tiden vise \u2014 men prisargumentet alene g\u00f8r den v\u00e6rd at holde \u00f8je med.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Kilder<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/blog.google\/innovation-and-ai\/models-and-research\/gemini-models\/gemini-3-1-flash-lite\/\" target=\"_blank\" rel=\"noopener\">Gemini 3.1 Flash-Lite<\/a> \u2014 Google Blog, 3. marts 2026<\/li>\n<li><a href=\"https:\/\/siliconangle.com\/2026\/03\/03\/google-launches-speedy-gemini-3-1-flash-lite-model-preview\/\" target=\"_blank\" rel=\"noopener\">Google launches speedy Gemini 3.1 Flash-Lite model in preview<\/a> \u2014 SiliconANGLE, 3. marts 2026<\/li>\n<li><a href=\"https:\/\/venturebeat.com\/technology\/google-releases-gemini-3-1-flash-lite-at-1-8th-the-cost-of-pro\" target=\"_blank\" rel=\"noopener\">Google releases Gemini 3.1 Flash Lite at 1\/8th the cost of Pro<\/a> \u2014 VentureBeat, 3. marts 2026<\/li>\n<li><a href=\"https:\/\/openai.com\/index\/gpt-5-3-instant\/\" target=\"_blank\" rel=\"noopener\">GPT-5.3 Instant<\/a> \u2014 OpenAI, 4. marts 2026<\/li>\n<\/ul>\n\n\n\n<p><em>Denne artikel er skrevet i samarbejde med AI, og efterf\u00f8lgende redigeret af et rigtigt menneske \ud83d\ude42<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Google lancerer Gemini 3.1 Flash-Lite \u2014 otte gange billigere end Pro og 45% hurtigere. Den billigste Gemini-model nogensinde.<\/p>\n","protected":false},"author":1,"featured_media":742,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[8,7],"tags":[66,31],"class_list":["post-743","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai","category-techology","tag-google","tag-language-models"],"acf":[],"_links":{"self":[{"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/posts\/743","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/comments?post=743"}],"version-history":[{"count":2,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/posts\/743\/revisions"}],"predecessor-version":[{"id":1005,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/posts\/743\/revisions\/1005"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/media\/742"}],"wp:attachment":[{"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/media?parent=743"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/categories?post=743"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/tags?post=743"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}