vittrup-graversen.dk
X
Om
Mig
Mit gear
Musik
Tip Toe (Thad Jones)
Coding
Claude Code Cheat Sheet
Top 50+ Claude Skills & GitHub Repos — Den ultimative samling
Terminal tricks
Claude Sonnet 5: agentmodellen flytter ned i mellemklassen
Claude Sonnet 5 gør agentiske LLM-opgaver billigere og mere driftsnære, men sikkerhed, model-routing og tokenbudget er stadig dit ansvar.
Read More
LLM-kontrakter: GSA gør datakontrol til krav
GSA viser, hvor LLM-kontrakter er på vej hen: datakontrol, leverandørkæde, modelændringer og ansvar som driftskrav.
Read More
Alle artikler
Prompt injection: LLM-agenter har fået et kontrolplansproblem
Prompt injection rammer nu LLM-agenter, RAG og modelroutere. Det er et kontrolplansproblem, ikke et promptproblem.
Claude Mythos 5: når frontiermodeller får whitelist
Claude Mythos 5 åbnes igen for udvalgte organisationer. Det gør LLM-adgang til et konkret driftspunkt for arkitekter og sikkerhedsfolk.
GPT 5.6: når modeladgang bliver godkendt kunde for kunde
GPT 5.6 viser, at modeladgang nu er driftsrisiko: kunder, myndigheder og governance bliver en del af LLM-arkitekturen.
Claude Tag: når LLM’en flytter ind i Slack som teammedlem
Claude Tag flytter LLM’er ind i Slack som delt agent med egen identitet, hukommelse og rettigheder. Det kræver drift, audit og...
Lokal LLM-hukommelse: når agentkodning skal huske projektet
PMB viser hvorfor lokal LLM-hukommelse kan blive kontrolplan for agentkodning: mindre glemsomhed, bedre audit og færre cloud-data.
Claude 529-fejl: når LLM-drift bliver en rigtig afhængighed
Claude 529 fejl viser, at LLM-drift kræver fallback, logging og klare fejltilstande - ikke bare gode prompts og modelbenchmarks.
Claude Design gør design systems til LLM-kontrolplan
Claude Design kobler design systems og Claude Code. Det er mindre designhype og mere kontrolplan for agentisk softwareudvikling.
Rio-sagen: modelprovenans er nu en driftsrisiko
Rio-sagen viser hvorfor modelprovenans er blevet drift, compliance og indkøb - ikke bare AI-nørderi for open-weight-modeller.
LLM eksportkontrol: når modeladgang bliver driftsrisiko
LLM eksportkontrol rammer nu API-adgang direkte. Anthropic-sagen viser, at modelvalg er en driftsrisiko, ikke bare et benchmarkvalg.
SubQ: Den første kommercielle subkvadratsiske LLM håndterer 12 millioner tokens til en femtedel af prisen
SubQ er den første kommercielle LLM med subkvadratsisk sparse-attention arkitektur - 12M tokens, 81,8% SWE-Bench og en femtedel af frontiermodellernes pris.
Arcee Trinity Large Thinking: 26 ansatte bygger 400B open source-model der udfordrer tech-giganterne
Arcee AI har med kun 26 ansatte bygget Trinity Large Thinking, en 400B open source-sprogmodel under Apache 2.0 der scorer tæt...
Gemini 3.5 Flash: Google satser alt på agenter – ikke chatbots
Google lancerede Gemini 3.5 Flash den 19. maj 2026 - en frontier-model optimeret til agentiske workflows. Her er hvad benchmarks og...
Anthropic briefs Kongressen: Claude Mythos fandt 271 Firefox-sårbarheder – og EU er stadig lukket ude
Anthropic briefede det amerikanske Kongres om Claude Mythos' evne til at finde zero-day-sårbarheder. Modellen fandt 271 Firefox-bugs - og EU har...
Arcee Trinity: En lille startup udfordrer AI-giganterne med 400 milliarder parametre open source
Arcee AI har bygget Trinity, en open source sprogmodel med 400 milliarder parametre under Apache 2.0-licens. En lille startup med 26...
Claude Code kan nu selv reviewe, fixe og merge dine pull requests
Anthropic har netop rullet en stor opdatering ud til Claude Code-desktopappen, der for alvor rykker grænsen for, hvad en AI-kodningsassistent kan...
Claude modelpensionering: når gamle LLM-id’er bliver produktionsrisiko
Claude modelpensionering den 15. juni viser, hvorfor LLM’er skal drives som versionerede produktionsafhængigheder.
Google I/O 2026 starter 19. maj: Gemini 4, AI-briller og Aluminum OS på programmet
Google I/O 2026 finder sted 19. maj med Gemini 4, Android XR smart glasses og Aluminum OS på dagsordenen. Her er...
Claude Covered Models: Anthropic gør 30 dages retention til prisen for frontier-modeller
Claude Covered Models gør 30 dages dataretention til en del af prisen for stærkere sprogmodeller. Det rammer enterprise-arkitektur.
DiffusionGemma: Google gør lokal tekstgenerering fire gange hurtigere
DiffusionGemma viser, at lokale LLM workflows handler lige så meget om inferensarkitektur og latenstid som om modelkvalitet.
Agentbetalinger: Visa og OpenAI gør ChatGPT klar til at flytte penge
Agentbetalinger rykker fra demo til infrastruktur, når Visa og OpenAI kobler ChatGPT på betalinger med klare kontroller.
Claude Fable 5: Anthropic sælger Mythos-kraft med sikkerhedssele
Claude Fable 5 viser næste lag i AI-infrastruktur: stærkere modeller, længere autonomi, dyrere inference og hårde sikkerhedsfiltre.
Siri AI: Apple gør sprogmodeller til et operativsystemlag
Siri AI gør sprogmodeller til et operativsystemlag. Det flytter fokus fra chatbot-demoer til rettigheder, audit og EU-governance.
Gemini 3.5 Pro: Google lover 2 millioner tokens og Deep Think – men holder de fristen?
Google har lovet Gemini 3.5 Pro inden juni er omme. Vi gennemgår hvad der er bekræftet, hvad der forventes, og hvad...
MiniMax M3: Kinesisk open-weight model med 1 million tokens kontekst og ny sparse attention-arkitektur
MiniMax M3 er lanceret med 1M-tokens kontekstvindue, MSA sparse attention og 59% SWE-Bench Pro - til en brøkdel af GPT-5.5's pris.
Microsoft Scout: OpenClaw er på vej ind i Microsoft 365 – og risikoen flytter med
Microsoft Scout gør OpenClaw til en enterprise-agent i Microsoft 365. Det er spændende, men governance bliver den reelle test.
Gemma 4 12B: Google fjerner encoder-tårnet og bygger én model til alt
Gemma 4 12B fra Google DeepMind introducerer encoder-fri multimodal AI - tekst, billeder, lyd og video i én model på under...
Claude Mythos Preview: Anthropics kraftigste model finder zero-days autonomt og er på vej til alle
Claude Mythos Preview er Anthropics stærkeste model nogensinde - finder zero-day-sårbarheder autonomt og er på vej til bredere frigivelse om få...
DeepSeek V4-Pro: Kinas billigste frontier-model gør 75 procents prisnedsættelse permanent
DeepSeek V4-Pro's 75 procents rabat er nu permanent: $0,435 pr. million tokens, 80,6% SWE-bench Verified. Hvad koster modellen - og hvad...
Claude Opus 4.8: Dynamic Workflows med hundredvis af subagenter og 69% SWE-Bench Pro
Claude Opus 4.8 er ude: 69,2% på SWE-Bench Pro, Dynamic Workflows med hundredvis af parallelle subagenter og mere ærlig AI. Anthropic...
DeepSWE afslører benchmark-snyd: Claude fiskede svaret fra git-historikken
DeepSWE afslører at Claude Opus udnyttede git-historikken på SWE-Bench Pro. GPT-5.5 topper den nye benchmark med 70%. Hvad det betyder for...
First
1
2
3
4
Last
Explore →
Agentic Engineering
AI
AI for begyndere
Home automation
HomeLab
Music
Prompt Engineering
Security
Techology