vittrup-graversen.dk -

lokal LLM GLM-5.2 Colibrì disk-streaming

Colibrì og GLM-5.2: 744B på laptop er stadig kun en langsom demo

Colibrì kan starte GLM-5.2 på en laptop med 25 GB RAM. Det er teknisk spændende, men stadig alt for langsomt til...

Morten
jul 15, 2026 2 min read

Programmatic tool calling: når LLM-agenten skriver sin egen orkestrering

Programmatic tool calling i GPT-5.6 flytter agent-loopet ind i en V8-sandbox. Det kræver bedre API-kontrakter, audit og godkendelser.

Morten
jul 13, 2026 2 min read

private LLM-endpoints i enterprise cloud

Private LLM-endpoints: åbne modeller flytter ind i enterprise-driften

Private LLM-endpoints gør åbne modeller mere realistiske i produktion. OCI viser, at modelvalg nu er infrastruktur, drift og governance.

Morten
jul 12, 2026 3 min read

GPT-5.6 i Microsoft 365 Copilot som LLM-kontrolplan

GPT-5.6 flytter ind i Microsoft 365

GPT-5.6 lander i Microsoft 365 Copilot og ChatGPT Work. Det gør modelvalg, adgangsstyring og agenthandlinger til drift.

Morten
jul 10, 2026 3 min read

GPT-Live voice agents som kontrolplan for LLM-routing

GPT-Live: voice agents bliver LLM-kontrolplan

GPT-Live gør ChatGPT Voice til et live kontrolplan med modelrouting, sikkerhed og nye driftskrav for voice agents i produktion.

Morten
jul 10, 2026 2 min read

LLM-routing og modeløkonomi i enterprise AI

LLM-routing: modelvalget er blevet et kontrolplan

LLM-routing flytter modelvalg fra promptkode til kontrolplan. Pris, data, governance og geopolitik skal styres sammen.

Morten
jul 8, 2026 3 min read

J-space: Claude får et vindue ind i sine skjulte tanker

Anthropic viser J-space i Claude: et muligt vindue ind i skjult LLM-ræsonnering, sikkerhedssignaler og agentkontrol.

Morten
jul 7, 2026 3 min read

Gemini Omni Flash som multimodal produktionspipeline

Gemini Omni Flash: når multimodale modeller bliver produktionsværktøj

Gemini Omni Flash flytter multimodal AI fra demo til drift. Det kræver budgetstyring, logging og klare regler for syntetisk medieproduktion.

Morten
jul 3, 2026 2 min read

GLM-5.2 og open-weight LLM til agentisk kodning

GLM-5.2: open-weight LLM’er presser frontiermodellerne

GLM-5.2 viser, at open-weight LLM’er nu presser frontiermodeller på lange agentopgaver. Det sænker prisen, men øger kravene til kontrol.

Morten
jul 3, 2026 3 min read

Claude Sonnet 5 som agentisk LLM i produktion

Claude Sonnet 5: agentmodellen flytter ned i mellemklassen

Claude Sonnet 5 gør agentiske LLM-opgaver billigere og mere driftsnære, men sikkerhed, model-routing og tokenbudget er stadig dit ansvar.

Morten
jul 2, 2026 3 min read

LLM-kontrakter og datakontrol i offentlige AI-systemer

LLM-kontrakter: GSA gør datakontrol til krav

GSA viser, hvor LLM-kontrakter er på vej hen: datakontrol, leverandørkæde, modelændringer og ansvar som driftskrav.

Morten
jun 30, 2026 3 min read

Prompt injection: LLM-agenter har fået et kontrolplansproblem

Prompt injection rammer nu LLM-agenter, RAG og modelroutere. Det er et kontrolplansproblem, ikke et promptproblem.

Morten
jun 29, 2026 2 min read

Claude Mythos 5 adgangsstyring for sprogmodeller

Claude Mythos 5: når frontiermodeller får whitelist

Claude Mythos 5 åbnes igen for udvalgte organisationer. Det gør LLM-adgang til et konkret driftspunkt for arkitekter og sikkerhedsfolk.

Morten
jun 27, 2026 2 min read

GPT 5.6: når modeladgang bliver godkendt kunde for kunde

GPT 5.6 viser, at modeladgang nu er driftsrisiko: kunder, myndigheder og governance bliver en del af LLM-arkitekturen.

Morten
jun 26, 2026 2 min read

Claude Tag: når LLM’en flytter ind i Slack som teammedlem

Claude Tag flytter LLM’er ind i Slack som delt agent med egen identitet, hukommelse og rettigheder. Det kræver drift, audit og...

Morten
jun 24, 2026 2 min read

lokal LLM-hukommelse for AI coding agents

Lokal LLM-hukommelse: når agentkodning skal huske projektet

PMB viser hvorfor lokal LLM-hukommelse kan blive kontrolplan for agentkodning: mindre glemsomhed, bedre audit og færre cloud-data.

Morten
jun 23, 2026 3 min read

Claude 529-fejl: når LLM-drift bliver en rigtig afhængighed

Claude 529 fejl viser, at LLM-drift kræver fallback, logging og klare fejltilstande - ikke bare gode prompts og modelbenchmarks.

Morten
jun 22, 2026 2 min read

Claude Design og design systems som LLM-kontrolplan

Claude Design gør design systems til LLM-kontrolplan

Claude Design kobler design systems og Claude Code. Det er mindre designhype og mere kontrolplan for agentisk softwareudvikling.

Morten
jun 18, 2026 3 min read

Rio-sagen: modelprovenans er nu en driftsrisiko

Rio-sagen viser hvorfor modelprovenans er blevet drift, compliance og indkøb - ikke bare AI-nørderi for open-weight-modeller.

Morten
jun 16, 2026 3 min read

LLM eksportkontrol og modeladgang som driftsrisiko

LLM eksportkontrol: når modeladgang bliver driftsrisiko

LLM eksportkontrol rammer nu API-adgang direkte. Anthropic-sagen viser, at modelvalg er en driftsrisiko, ikke bare et benchmarkvalg.

Morten
jun 15, 2026 3 min read

SubQ: Den første kommercielle subkvadratsiske LLM håndterer 12 millioner tokens til en femtedel af prisen

SubQ er den første kommercielle LLM med subkvadratsisk sparse-attention arkitektur - 12M tokens, 81,8% SWE-Bench og en femtedel af frontiermodellernes pris.

Morten
jun 14, 2026 2 min read

Arcee Trinity Large Thinking: 26 ansatte bygger 400B open source-model der udfordrer tech-giganterne

Arcee AI har med kun 26 ansatte bygget Trinity Large Thinking, en 400B open source-sprogmodel under Apache 2.0 der scorer tæt...

Morten
jun 14, 2026 3 min read

Gemini 3.5 Flash: Google satser alt på agenter – ikke chatbots

Google lancerede Gemini 3.5 Flash den 19. maj 2026 - en frontier-model optimeret til agentiske workflows. Her er hvad benchmarks og...

Morten
jun 14, 2026 2 min read

Anthropic briefs Kongressen: Claude Mythos fandt 271 Firefox-sårbarheder – og EU er stadig lukket ude

Anthropic briefede det amerikanske Kongres om Claude Mythos' evne til at finde zero-day-sårbarheder. Modellen fandt 271 Firefox-bugs - og EU har...

Morten
jun 14, 2026 2 min read

Arcee Trinity: En lille startup udfordrer AI-giganterne med 400 milliarder parametre open source

Arcee AI har bygget Trinity, en open source sprogmodel med 400 milliarder parametre under Apache 2.0-licens. En lille startup med 26...

Morten
jun 14, 2026 2 min read

Claude Code kan nu selv reviewe, fixe og merge dine pull requests

Anthropic har netop rullet en stor opdatering ud til Claude Code-desktopappen, der for alvor rykker grænsen for, hvad en AI-kodningsassistent kan...

Morten
jun 14, 2026 1 min read

Claude modelpensionering: når gamle LLM-id’er bliver produktionsrisiko

Claude modelpensionering den 15. juni viser, hvorfor LLM’er skal drives som versionerede produktionsafhængigheder.

Morten
jun 14, 2026 3 min read

Google I/O 2026 developer conference scene med Gemini 4 og AI-teknologi

Google I/O 2026 starter 19. maj: Gemini 4, AI-briller og Aluminum OS på programmet

Google I/O 2026 finder sted 19. maj med Gemini 4, Android XR smart glasses og Aluminum OS på dagsordenen. Her er...

Morten
jun 14, 2026 2 min read

Claude Covered Models dataretention for sprogmodeller

Claude Covered Models: Anthropic gør 30 dages retention til prisen for frontier-modeller

Claude Covered Models gør 30 dages dataretention til en del af prisen for stærkere sprogmodeller. Det rammer enterprise-arkitektur.

Morten
jun 14, 2026 3 min read

DiffusionGemma tekstgenerering og lokale LLM workflows

DiffusionGemma: Google gør lokal tekstgenerering fire gange hurtigere

DiffusionGemma viser, at lokale LLM workflows handler lige så meget om inferensarkitektur og latenstid som om modelkvalitet.

Morten
jun 12, 2026 3 min read

Inkling-Small gør åbne LLM’er mere driftsbare Inkling-Small viser, at åbne LLM’er ikke kun handler om benchmarks. Licens, GPU-krav og kontrolplan er blevet drift. Read More

Claude Opus 5 gør agentmodeller til hverdagsdrift Claude Opus 5 flytter stærk agent- og kodekapacitet ned i en mere praktisk prisramme. Men kontrollen skal følge med. Read More

Alle artikler

Colibrì og GLM-5.2: 744B på laptop er stadig kun en langsom demo

Programmatic tool calling: når LLM-agenten skriver sin egen orkestrering

Private LLM-endpoints: åbne modeller flytter ind i enterprise-driften

GPT-5.6 flytter ind i Microsoft 365

GPT-Live: voice agents bliver LLM-kontrolplan

LLM-routing: modelvalget er blevet et kontrolplan

J-space: Claude får et vindue ind i sine skjulte tanker

Gemini Omni Flash: når multimodale modeller bliver produktionsværktøj

GLM-5.2: open-weight LLM’er presser frontiermodellerne

Claude Sonnet 5: agentmodellen flytter ned i mellemklassen

LLM-kontrakter: GSA gør datakontrol til krav

Prompt injection: LLM-agenter har fået et kontrolplansproblem

Claude Mythos 5: når frontiermodeller får whitelist

GPT 5.6: når modeladgang bliver godkendt kunde for kunde

Claude Tag: når LLM’en flytter ind i Slack som teammedlem

Lokal LLM-hukommelse: når agentkodning skal huske projektet

Claude 529-fejl: når LLM-drift bliver en rigtig afhængighed

Claude Design gør design systems til LLM-kontrolplan

Rio-sagen: modelprovenans er nu en driftsrisiko

LLM eksportkontrol: når modeladgang bliver driftsrisiko

SubQ: Den første kommercielle subkvadratsiske LLM håndterer 12 millioner tokens til en femtedel af prisen

Arcee Trinity Large Thinking: 26 ansatte bygger 400B open source-model der udfordrer tech-giganterne

Gemini 3.5 Flash: Google satser alt på agenter – ikke chatbots

Anthropic briefs Kongressen: Claude Mythos fandt 271 Firefox-sårbarheder – og EU er stadig lukket ude

Arcee Trinity: En lille startup udfordrer AI-giganterne med 400 milliarder parametre open source

Claude Code kan nu selv reviewe, fixe og merge dine pull requests

Claude modelpensionering: når gamle LLM-id’er bliver produktionsrisiko

Google I/O 2026 starter 19. maj: Gemini 4, AI-briller og Aluminum OS på programmet

Claude Covered Models: Anthropic gør 30 dages retention til prisen for frontier-modeller

DiffusionGemma: Google gør lokal tekstgenerering fire gange hurtigere

Explore →