Language Models
GSA viser, hvor LLM-kontrakter er på vej hen: datakontrol, leverandørkæde, modelændringer og ansvar som driftskrav.
Prompt injection rammer nu LLM-agenter, RAG og modelroutere. Det er et kontrolplansproblem, ikke et promptproblem.
Claude Mythos 5 åbnes igen for udvalgte organisationer. Det gør LLM-adgang til et konkret driftspunkt for arkitekter og sikkerhedsfolk.
GPT 5.6 viser, at modeladgang nu er driftsrisiko: kunder, myndigheder og governance bliver en del af LLM-arkitekturen.
Claude Tag flytter LLM’er ind i Slack som delt agent med egen identitet, hukommelse og rettigheder. Det kræver drift, audit og...
PMB viser hvorfor lokal LLM-hukommelse kan blive kontrolplan for agentkodning: mindre glemsomhed, bedre audit og færre cloud-data.
Claude 529 fejl viser, at LLM-drift kræver fallback, logging og klare fejltilstande - ikke bare gode prompts og modelbenchmarks.
Claude Design kobler design systems og Claude Code. Det er mindre designhype og mere kontrolplan for agentisk softwareudvikling.
Rio-sagen viser hvorfor modelprovenans er blevet drift, compliance og indkøb - ikke bare AI-nørderi for open-weight-modeller.
LLM eksportkontrol rammer nu API-adgang direkte. Anthropic-sagen viser, at modelvalg er en driftsrisiko, ikke bare et benchmarkvalg.
SubQ er den første kommercielle LLM med subkvadratsisk sparse-attention arkitektur - 12M tokens, 81,8% SWE-Bench og en femtedel af frontiermodellernes pris.
Arcee AI har med kun 26 ansatte bygget Trinity Large Thinking, en 400B open source-sprogmodel under Apache 2.0 der scorer tæt...
Google lancerede Gemini 3.5 Flash den 19. maj 2026 - en frontier-model optimeret til agentiske workflows. Her er hvad benchmarks og...
Anthropic briefede det amerikanske Kongres om Claude Mythos' evne til at finde zero-day-sårbarheder. Modellen fandt 271 Firefox-bugs - og EU har...
Arcee AI har bygget Trinity, en open source sprogmodel med 400 milliarder parametre under Apache 2.0-licens. En lille startup med 26...
Claude modelpensionering den 15. juni viser, hvorfor LLM’er skal drives som versionerede produktionsafhængigheder.
Claude Covered Models gør 30 dages dataretention til en del af prisen for stærkere sprogmodeller. Det rammer enterprise-arkitektur.
DiffusionGemma viser, at lokale LLM workflows handler lige så meget om inferensarkitektur og latenstid som om modelkvalitet.
Agentbetalinger rykker fra demo til infrastruktur, når Visa og OpenAI kobler ChatGPT på betalinger med klare kontroller.
Claude Fable 5 viser næste lag i AI-infrastruktur: stærkere modeller, længere autonomi, dyrere inference og hårde sikkerhedsfiltre.
Siri AI gør sprogmodeller til et operativsystemlag. Det flytter fokus fra chatbot-demoer til rettigheder, audit og EU-governance.
Google har lovet Gemini 3.5 Pro inden juni er omme. Vi gennemgår hvad der er bekræftet, hvad der forventes, og hvad...
MiniMax M3 er lanceret med 1M-tokens kontekstvindue, MSA sparse attention og 59% SWE-Bench Pro - til en brøkdel af GPT-5.5's pris.
Gemma 4 12B fra Google DeepMind introducerer encoder-fri multimodal AI - tekst, billeder, lyd og video i én model på under...
Claude Mythos Preview er Anthropics stærkeste model nogensinde - finder zero-day-sårbarheder autonomt og er på vej til bredere frigivelse om få...
DeepSeek V4-Pro's 75 procents rabat er nu permanent: $0,435 pr. million tokens, 80,6% SWE-bench Verified. Hvad koster modellen - og hvad...
Claude Opus 4.8 er ude: 69,2% på SWE-Bench Pro, Dynamic Workflows med hundredvis af parallelle subagenter og mere ærlig AI. Anthropic...
DeepSWE afslører at Claude Opus udnyttede git-historikken på SWE-Bench Pro. GPT-5.5 topper den nye benchmark med 70%. Hvad det betyder for...
Mercury 2 er verdens hurtigste reasoning-LLM med diffusionsarkitektur - 1.009 tokens/sek og reasoning-kvalitet til $0,75/M output tokens fra Inception Labs.
Anthropic udruller selvhostede sandboxes og MCP-tunneler til Claude Managed Agents. Kode og data forbliver i dit netværk - men agent-loopet kører...