Language Models Archives - vittrup-graversen.dk

Language Models

lokal LLM GLM-5.2 Colibrì disk-streaming

Colibrì og GLM-5.2: 744B på laptop er stadig kun en langsom demo

Colibrì kan starte GLM-5.2 på en laptop med 25 GB RAM. Det er teknisk spændende, men stadig alt for langsomt til...

Morten
jul 15, 2026 2 min read

Programmatic tool calling: når LLM-agenten skriver sin egen orkestrering

Programmatic tool calling i GPT-5.6 flytter agent-loopet ind i en V8-sandbox. Det kræver bedre API-kontrakter, audit og godkendelser.

Morten
jul 13, 2026 2 min read

private LLM-endpoints i enterprise cloud

Private LLM-endpoints: åbne modeller flytter ind i enterprise-driften

Private LLM-endpoints gør åbne modeller mere realistiske i produktion. OCI viser, at modelvalg nu er infrastruktur, drift og governance.

Morten
jul 12, 2026 3 min read

GPT-5.6 i Microsoft 365 Copilot som LLM-kontrolplan

GPT-5.6 flytter ind i Microsoft 365

GPT-5.6 lander i Microsoft 365 Copilot og ChatGPT Work. Det gør modelvalg, adgangsstyring og agenthandlinger til drift.

Morten
jul 10, 2026 3 min read

GPT-Live voice agents som kontrolplan for LLM-routing

GPT-Live: voice agents bliver LLM-kontrolplan

GPT-Live gør ChatGPT Voice til et live kontrolplan med modelrouting, sikkerhed og nye driftskrav for voice agents i produktion.

Morten
jul 10, 2026 2 min read

LLM-routing og modeløkonomi i enterprise AI

LLM-routing: modelvalget er blevet et kontrolplan

LLM-routing flytter modelvalg fra promptkode til kontrolplan. Pris, data, governance og geopolitik skal styres sammen.

Morten
jul 8, 2026 3 min read

J-space: Claude får et vindue ind i sine skjulte tanker

Anthropic viser J-space i Claude: et muligt vindue ind i skjult LLM-ræsonnering, sikkerhedssignaler og agentkontrol.

Morten
jul 7, 2026 3 min read

Gemini Omni Flash som multimodal produktionspipeline

Gemini Omni Flash: når multimodale modeller bliver produktionsværktøj

Gemini Omni Flash flytter multimodal AI fra demo til drift. Det kræver budgetstyring, logging og klare regler for syntetisk medieproduktion.

Morten
jul 3, 2026 2 min read

GLM-5.2 og open-weight LLM til agentisk kodning

GLM-5.2: open-weight LLM’er presser frontiermodellerne

GLM-5.2 viser, at open-weight LLM’er nu presser frontiermodeller på lange agentopgaver. Det sænker prisen, men øger kravene til kontrol.

Morten
jul 3, 2026 3 min read

Claude Sonnet 5 som agentisk LLM i produktion

Claude Sonnet 5: agentmodellen flytter ned i mellemklassen

Claude Sonnet 5 gør agentiske LLM-opgaver billigere og mere driftsnære, men sikkerhed, model-routing og tokenbudget er stadig dit ansvar.

Morten
jul 2, 2026 3 min read

LLM-kontrakter og datakontrol i offentlige AI-systemer

LLM-kontrakter: GSA gør datakontrol til krav

GSA viser, hvor LLM-kontrakter er på vej hen: datakontrol, leverandørkæde, modelændringer og ansvar som driftskrav.

Morten
jun 30, 2026 3 min read

Prompt injection: LLM-agenter har fået et kontrolplansproblem

Prompt injection rammer nu LLM-agenter, RAG og modelroutere. Det er et kontrolplansproblem, ikke et promptproblem.

Morten
jun 29, 2026 2 min read

Claude Mythos 5 adgangsstyring for sprogmodeller

Claude Mythos 5: når frontiermodeller får whitelist

Claude Mythos 5 åbnes igen for udvalgte organisationer. Det gør LLM-adgang til et konkret driftspunkt for arkitekter og sikkerhedsfolk.

Morten
jun 27, 2026 2 min read

GPT 5.6: når modeladgang bliver godkendt kunde for kunde

GPT 5.6 viser, at modeladgang nu er driftsrisiko: kunder, myndigheder og governance bliver en del af LLM-arkitekturen.

Morten
jun 26, 2026 2 min read

Claude Tag: når LLM’en flytter ind i Slack som teammedlem

Claude Tag flytter LLM’er ind i Slack som delt agent med egen identitet, hukommelse og rettigheder. Det kræver drift, audit og...

Morten
jun 24, 2026 2 min read

lokal LLM-hukommelse for AI coding agents

Lokal LLM-hukommelse: når agentkodning skal huske projektet

PMB viser hvorfor lokal LLM-hukommelse kan blive kontrolplan for agentkodning: mindre glemsomhed, bedre audit og færre cloud-data.

Morten
jun 23, 2026 3 min read

Claude 529-fejl: når LLM-drift bliver en rigtig afhængighed

Claude 529 fejl viser, at LLM-drift kræver fallback, logging og klare fejltilstande - ikke bare gode prompts og modelbenchmarks.

Morten
jun 22, 2026 2 min read

Claude Design og design systems som LLM-kontrolplan

Claude Design gør design systems til LLM-kontrolplan

Claude Design kobler design systems og Claude Code. Det er mindre designhype og mere kontrolplan for agentisk softwareudvikling.

Morten
jun 18, 2026 3 min read

Rio-sagen: modelprovenans er nu en driftsrisiko

Rio-sagen viser hvorfor modelprovenans er blevet drift, compliance og indkøb - ikke bare AI-nørderi for open-weight-modeller.

Morten
jun 16, 2026 3 min read

LLM eksportkontrol og modeladgang som driftsrisiko

LLM eksportkontrol: når modeladgang bliver driftsrisiko

LLM eksportkontrol rammer nu API-adgang direkte. Anthropic-sagen viser, at modelvalg er en driftsrisiko, ikke bare et benchmarkvalg.

Morten
jun 15, 2026 3 min read

SubQ: Den første kommercielle subkvadratsiske LLM håndterer 12 millioner tokens til en femtedel af prisen

SubQ er den første kommercielle LLM med subkvadratsisk sparse-attention arkitektur - 12M tokens, 81,8% SWE-Bench og en femtedel af frontiermodellernes pris.

Morten
jun 14, 2026 2 min read

Arcee Trinity Large Thinking: 26 ansatte bygger 400B open source-model der udfordrer tech-giganterne

Arcee AI har med kun 26 ansatte bygget Trinity Large Thinking, en 400B open source-sprogmodel under Apache 2.0 der scorer tæt...

Morten
jun 14, 2026 3 min read

Gemini 3.5 Flash: Google satser alt på agenter – ikke chatbots

Google lancerede Gemini 3.5 Flash den 19. maj 2026 - en frontier-model optimeret til agentiske workflows. Her er hvad benchmarks og...

Morten
jun 14, 2026 2 min read

Anthropic briefs Kongressen: Claude Mythos fandt 271 Firefox-sårbarheder – og EU er stadig lukket ude

Anthropic briefede det amerikanske Kongres om Claude Mythos' evne til at finde zero-day-sårbarheder. Modellen fandt 271 Firefox-bugs - og EU har...

Morten
jun 14, 2026 2 min read

Arcee Trinity: En lille startup udfordrer AI-giganterne med 400 milliarder parametre open source

Arcee AI har bygget Trinity, en open source sprogmodel med 400 milliarder parametre under Apache 2.0-licens. En lille startup med 26...

Morten
jun 14, 2026 2 min read

Claude modelpensionering: når gamle LLM-id’er bliver produktionsrisiko

Claude modelpensionering den 15. juni viser, hvorfor LLM’er skal drives som versionerede produktionsafhængigheder.

Morten
jun 14, 2026 3 min read

Claude Covered Models dataretention for sprogmodeller

Claude Covered Models: Anthropic gør 30 dages retention til prisen for frontier-modeller

Claude Covered Models gør 30 dages dataretention til en del af prisen for stærkere sprogmodeller. Det rammer enterprise-arkitektur.

Morten
jun 14, 2026 3 min read

DiffusionGemma tekstgenerering og lokale LLM workflows

DiffusionGemma: Google gør lokal tekstgenerering fire gange hurtigere

DiffusionGemma viser, at lokale LLM workflows handler lige så meget om inferensarkitektur og latenstid som om modelkvalitet.

Morten
jun 12, 2026 3 min read

Agentbetalinger: Visa og OpenAI gør ChatGPT klar til at flytte penge

Agentbetalinger rykker fra demo til infrastruktur, når Visa og OpenAI kobler ChatGPT på betalinger med klare kontroller.

Morten
jun 11, 2026 3 min read

Claude Fable 5 som safeguarded frontier AI til enterprise og udviklere

Claude Fable 5: Anthropic sælger Mythos-kraft med sikkerhedssele

Claude Fable 5 viser næste lag i AI-infrastruktur: stærkere modeller, længere autonomi, dyrere inference og hårde sikkerhedsfiltre.

Morten
jun 10, 2026 3 min read