{"id":1525,"date":"2026-06-07T15:34:48","date_gmt":"2026-06-07T13:34:48","guid":{"rendered":"https:\/\/vittrup-graversen.dk\/?p=1525"},"modified":"2026-06-07T15:34:49","modified_gmt":"2026-06-07T13:34:49","slug":"minimax-m3-kinesisk-open-weight-model-med-1-million-tokens-kontekst-og-ny-sparse-attention-arkitektur","status":"publish","type":"post","link":"https:\/\/vittrup-graversen.dk\/index.php\/2026\/06\/07\/minimax-m3-kinesisk-open-weight-model-med-1-million-tokens-kontekst-og-ny-sparse-attention-arkitektur\/","title":{"rendered":"MiniMax M3: Kinesisk open-weight model med 1 million tokens kontekst og ny sparse attention-arkitektur"},"content":{"rendered":"\n<p class=\"wp-block-paragraph\">Den 1. juni 2026 frigjorde den Shanghai-baserede AI-startup MiniMax deres nye flagskibsmodel M3 i general availability. MiniMax M3 er en open-weight, native multimodal model med et 1 million tokens kontekstvindue, en ny sparse attention-arkitektur og agentic kodningskapaciteter \u2013 alt tilg\u00e6ngeligt til en br\u00f8kdel af priserne p\u00e5 de lukkede frontier-modeller.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Modellen er tilg\u00e6ngelig via MiniMax.io API, Kimi Code CLI og OpenRouter, og open weights er annonceret til Hugging Face inden for kort tid.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">MSA \u2013 en ny sparse attention-mekanisme<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">Den tekniske kerne i MiniMax M3 er MSA (MiniMax Sparse Attention). Fuld kvadratisk attention skalerer d\u00e5rligt ved meget lange kontekster \u2013 ved 1 million tokens kr\u00e6ver den enorme m\u00e6ngder hukommelse og beregning. MSA l\u00f8ser problemet ved at erstatte fuld attention med KV-block selection: hver foresp\u00f8rgsel beh\u00f8ver kun at se de mest relevante blokke i cachen, ikke samtlige tokens.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">MiniMax rapporterer f\u00f8lgende forbedringer ved 1M-tokens kontekst sammenlignet med forg\u00e6ngeren M2:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Per-token compute reduceret til 1\/20 af M2<\/li>\n<li>Prefill-hastighed mere end 9x hurtigere<\/li>\n<li>Decoding mere end 15x hurtigere<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">I sammenligning med lignende sparse attention-tilgange som DSA og MoBA h\u00e6vder MiniMax, at MSA opdeler KV-cachen mere pr\u00e6cist og er mere end 4x hurtigere end open-source implementeringer som Flash-Sparse-Attention. If\u00f8lge interne ablation-studier matcher MSA fuld attention p\u00e5 st\u00f8rstedelen af kapacitetstest. Modellen underst\u00f8tter et kontekstvindue p\u00e5 op til 1 million tokens med et garanteret minimum p\u00e5 512.000 tokens, og inkluderer en vision encoder til billede- og videoinput.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Benchmarks og ydeevne<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">MiniMax M3 scorer p\u00e5 n\u00f8gle-benchmarks:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>SWE-Bench Pro: 59,0%<\/strong> \u2013 foran GPT-5.5 (57,7%) og Gemini 3.1 Pro (54,2%)<\/li>\n<li><strong>Terminal-Bench 2.1: 66,0%<\/strong><\/li>\n<li><strong>SWE-fficiency: 34,8%<\/strong><\/li>\n<li><strong>BrowseComp: 83,5<\/strong><\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">MiniMax h\u00e6vder, at M3 n\u00e6rmer sig Claude Opus 4.7 p\u00e5 SWE-Bench Pro (53,4%). Tallene ser st\u00e6rke ud \u2013 men alle benchmark-resultater er produceret internt af MiniMax p\u00e5 deres egen infrastruktur med egne evalueringsmilj\u00f8er. Uafh\u00e6ngig verifikation er endnu ikke offentliggjort. Det er pr\u00e6cis det m\u00f8nster vi kender fra andre kinesiske modeludgivelser: imponerende tal, som community\u2019et dern\u00e6st bruger uger p\u00e5 at efterpr\u00f8ve.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">Det er ogs\u00e5 v\u00e6rd at bem\u00e6rke, at SWE-Bench Pro og SWE-Bench Verified er to forskellige benchmarks med forskellig sv\u00e6rhedsgrad. Direkte sammenligning med modeller som <a href=\"https:\/\/vittrup-graversen.dk\/index.php\/2026\/05\/19\/mistral-medium-3-5-europaeisk-128b-model-tager-kampen-op-mod-gpt-5-5-med-async-kodningsagenter\/\">Mistral Medium 3.5 (77,6% SWE-Bench Verified)<\/a> kr\u00e6ver forsigtighed.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Priss\u00e6tning og tilg\u00e6ngelighed<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">M3 er tilg\u00e6ngelig p\u00e5 f\u00f8lgende platforme:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>MiniMax.io API \u2013 direkte adgang<\/li>\n<li>Kimi Code CLI \u2013 til kodningsopgaver<\/li>\n<li>OpenRouter \u2013 launch-promo ved ~$0,30\/million input tokens og $1,20\/million output tokens<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Til sammenligning koster Claude Sonnet 4.6 $3\/$15 per million tokens (input\/output), og GPT-5.5 er endnu dyrere. M3\u2019s prispunkt er aggressivt \u2013 og en open-weight licens betyder, at weights vil v\u00e6re tilg\u00e6ngelige via Hugging Face til lokal k\u00f8rsel og fine-tuning.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Kinesisk open-weight AI: det kritiske perspektiv<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">MiniMax er en Shanghai-baseret AI-startup grundlagt i 2021. Som alle kinesiske tech-selskaber opererer de under kinesisk lovgivning \u2013 herunder loven om datasikkerhed fra 2021 og loven om algoritmesikkerhed. Det har praktiske konsekvenser:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Kinesiske myndigheder kan kr\u00e6ve adgang til data behandlet via MiniMax\u2019s API-servere<\/li>\n<li>Modellen er certificeret under Kinas AI-sikkerhedskrav, som inkluderer filtrering af politisk f\u00f8lsomt indhold<\/li>\n<li>Open weights reducerer eksponeringen markant: k\u00f8rer du modellen lokalt, sendes dine data ikke til MiniMax\u2019s infrastruktur<\/li>\n<\/ul>\n\n\n\n<p class=\"wp-block-paragraph\">Det er samme grundl\u00e6ggende forbehold som ved <a href=\"https:\/\/vittrup-graversen.dk\/index.php\/2026\/05\/30\/deepseek-v4-pro-kinas-billigste-frontier-model-goer-75-procents-prisnedsaettelse-permanent\/\">DeepSeek V4-Pro<\/a> og Qwen3 \u2013 open-weight licensen \u00e6ndrer ikke selskabets juridiske forpligtelser. Til lokale eksperimenter og kodningsopgaver, der ikke involverer f\u00f8lsomme data, er M3 interessant. Til forretningsm\u00e6ssig brug med fortrolige data: k\u00f8r det selv, eller hold dig til europ\u00e6iske og amerikanske udbydere.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Konklusion<\/h2>\n\n\n\n<p class=\"wp-block-paragraph\">MiniMax M3 er en teknisk interessant model: MSA-arkitekturen er et reelt bidrag til sparse attention-feltet, 1 million tokens kontekstvindue \u00e5bner muligheder for lange kodebaser og dokumentanalyse, og prispunktet er aggressivt. Benchmark-tallene ser st\u00e6rke ud \u2013 men er udelukkende selvrapporterede og afventer uafh\u00e6ngig verifikation.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">M\u00f8nstret er velkendt: kinesiske labs frigiver konkurrencedygtige open-weight modeller til priser, de vestlige labs ikke kan matche. Det presser innovationen fremad for alle. Det \u00e6ndrer ikke p\u00e5 de strukturelle datasikkerheds- og censurproblemer, der f\u00f8lger med kinesisk lovgivning.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Kilder<\/h2>\n\n\n\n<ul class=\"wp-block-list\">\n<li><a href=\"https:\/\/www.minimax.io\/blog\/minimax-m3\" target=\"_blank\" rel=\"noopener\">MiniMax M3: Frontier Coding, 1M Context, Native Multimodality<\/a> \u2013 MiniMax, 1. juni 2026<\/li>\n<li><a href=\"https:\/\/venturebeat.com\/technology\/minimax-m3-debuts-eclipsing-gpt-5-5-and-gemini-3-1-pro-on-key-benchmark-performance-for-just-5-10-of-the-cost\" target=\"_blank\" rel=\"noopener\">MiniMax-M3 debuts, eclipsing GPT-5.5 and Gemini 3.1 Pro<\/a> \u2013 VentureBeat, juni 2026<\/li>\n<li><a href=\"https:\/\/www.marktechpost.com\/2026\/06\/01\/minimax-releases-minimax-m3-with-msa-architecture-supporting-1m-token-context-native-multimodality-and-agentic-coding\/\" target=\"_blank\" rel=\"noopener\">MiniMax Releases MiniMax M3 with MSA Architecture<\/a> \u2013 MarkTechPost, 1. juni 2026<\/li>\n<li><a href=\"https:\/\/pandaily.com\/minimax-m3-model-2026\" target=\"_blank\" rel=\"noopener\">MiniMax Launches M3 Model With 1M Context and Native Multimodal Capabilities<\/a> \u2013 Pandaily, 2026<\/li>\n<\/ul>\n\n","protected":false},"excerpt":{"rendered":"<p>MiniMax M3 er lanceret med 1M-tokens kontekstvindue, MSA sparse attention og 59% SWE-Bench Pro &#8211; til en br\u00f8kdel af GPT-5.5&#8217;s pris.<\/p>\n","protected":false},"author":1,"featured_media":1524,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[8],"tags":[31],"class_list":["post-1525","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai","tag-language-models"],"acf":[],"_links":{"self":[{"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/posts\/1525","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/comments?post=1525"}],"version-history":[{"count":1,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/posts\/1525\/revisions"}],"predecessor-version":[{"id":1528,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/posts\/1525\/revisions\/1528"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/media\/1524"}],"wp:attachment":[{"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/media?parent=1525"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/categories?post=1525"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/vittrup-graversen.dk\/index.php\/wp-json\/wp\/v2\/tags?post=1525"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}