NVIDIA GTC 2026: Vera Rubin-chippen lover 5x ydeevne — og sætter scenen for AI-hardwarens næste kapitel

Næste uge åbner NVIDIA sin årlige GPU Technology Conference (GTC) i San Jose, og dette års udgave tegner til at blive den mest betydningsfulde i årevis. I centrum står lanceringen af den nye Vera Rubin-platform — efterfølgeren til Blackwell-arkitekturen, der har domineret AI-datacentre siden 2024. Med op til 288 GB HBM4-hukommelse, 22 TB/s båndbredde og 35-50 petaFLOPS i NVFP4-ydeevne, leverer Rubin et generationsskifte på op til 5x i floating point-throughput sammenlignet med Blackwell.

Men bag de imponerende tal gemmer sig en kompleks historie om opkøb, konkurrence og en AI-industri, der i stigende grad kræver bevis for, at investeringerne rent faktisk betaler sig.

Rubin: 336 milliarder transistorer og HBM4

NVIDIA afslørede de første detaljer om Rubin allerede ved CES i januar 2026, men GTC bliver den officielle lancering. Chippen bygger på TSMC’s avancerede processer og pakker 336 milliarder transistorer ind i et design, der er specifikt optimeret til de Mixture-of-Experts (MoE)-modeller, som nu dominerer enterprise-AI. Ifølge The Register vil Rubin-GPU’er være tilgængelige i både otte-vejs HGX-platforme og NVL72-rack-systemer, der presser 72 Rubin SXM-moduler ind i ét enkelt rack.

Parallelt med GPU’en lanceres Vera CPU’en — en custom ARM-processor med 88 kerner, simultaneous multithreading og confidential computing-funktioner, som hidtil kun har været tilgængelige på x86-platforme. Meta er allerede i gang med at evaluere Vera til deres datacentre, efter at have været den første til at deploye forgængeren Grace i stor skala.

Groq-opkøbet ændrer spillet for inference

En af de mest interessante vinkler på GTC 2026 handler ikke om nye chips, men om et opkøb. NVIDIA købte Groq i december 2025 for hele 20 milliarder dollars — og her får vi sandsynligvis de første detaljer om, hvordan Groqs dataflow-arkitektur integreres med CUDA-økosystemet.

Baggrunden er enkel: NVIDIAs GPU’er er fremragende til at træne modeller, men kæmper med den latensintensive inference, som agentic AI og coding-assistenter kræver. Groqs SRAM-baserede chips kan levere over 1.000 tokens per sekund — langt mere end GPU-baserede systemer. Det var præcis den kapacitet, der fik Cerebras til at vinde OpenAI som kunde til deres nyeste modeller. NVIDIA havde simpelthen ikke noget tilsvarende — indtil Groq-opkøbet.

Hvis NVIDIA kan kombinere GPU-træning med Groq-inference i en samlet platform, kan det potentielt sænke tokenprisen med faktor 10 og eliminere en af de største barrierer for udbredelsen af AI-agenter.

Energi, køling og den praktiske virkelighed

Med stor ydeevne følger stort energiforbrug. Rubins termiske designeffekt estimeres til 1,8 kW per chip — og det gør væskekøling obligatorisk. For mange virksomheder er det en betydelig infrastruktur-investering, der kan gøre AMD’s luftkølede alternativer mere attraktive.

NVIDIA har også løftet sløret for Kyber-racket, et 600 kW-monstrum med 144 GPU-sokler, der forventes i 2027. Og allerede nu antydes Feynman-arkitekturen (2028), som kan blive den første chip produceret på TSMC’s 1,6nm A16-proces — med integreret silicium-fotonik, der erstatter traditionel datakommunikation med lys.

Jensen Huang bruger bevidst GTC til at signalere fremtidige strøm- og kølebehov flere år i forvejen, så datacenterindustrien kan nå at forberede sig. Med Feynman taler vi sandsynligvis om over en megawatt per rack.

Capex-kapløbet: Hundredvis af milliarder i spil

GTC 2026 finder sted midt i et hidtil uset investeringskapløb. Amazon har annonceret 200 milliarder dollars i kapitaludgifter for 2026, Alphabet 180 milliarder og Microsoft 155 milliarder — primært rettet mod AI-infrastruktur. Det skaber en massiv ordrebog for NVIDIA, men også intenst pres for at levere målbart afkast.

NVIDIAs aktie er faldet cirka 11% fra toppen i slutningen af 2025, og Wall Street er gået fra spekulativ hype til et krav om konkret ROI. Konferencen er ikke bare et produktshow — det er en strategisk manøvre for at overbevise en nervøs investorbase om, at overgangen fra eksperimentelle chatbots til produktiv agentic AI rent faktisk er i gang. Virksomheder som Microsoft investerer massivt i AI-agenter — og de har brug for hardware, der kan følge med.

Hvad betyder det for resten af branchen?

Konkurrencen i AI-chipmarkedet er mere levende end nogensinde. AMD’s kommende MI400-serie positionerer sig som et “value play” med 80% af NVIDIAs ydeevne til lavere totalomkostninger. Broadcom nyder godt af AI-networking uanset hvem der vinder chipkampen. Og i Kina træner firmaer som Zhipu AI allerede modeller med 744 milliarder parametre helt uden NVIDIA-hardware — et tydeligt signal om, at eksportkontroller accelererer udviklingen af alternative chipøkosystemer.

Samtidig vokser fænomenet “Sovereign AI” — nationer, der behandler computekraft som en strategisk ressource på linje med olie. Storbritannien har lanceret et infrastrukturprogram til 18 milliarder pund, og Saudi-Arabiens HUMAIN-projekt sigter mod 100 milliarder dollars. Det skaber en efterspørgselsbund for NVIDIA, der er uafhængig af Silicon Valleys venture-cyklusser.

Perspektiv: Fra chips til agenter

Det store billede ved GTC 2026 er, at hardware og software smelter sammen. NVIDIAs roadmap — Rubin nu, Kyber i 2027, Feynman i 2028 — er designet til en verden, hvor AI-agenter kører autonomt, 24/7, på dedikeret infrastruktur. Inference er ikke længere en sekundær workload; det er det primære forbrug. Og det kræver en fundamentalt anderledes chiparkitektur end den, vi brugte til at træne GPT-3.

For danske IT-professionelle er beskeden klar: AI-infrastruktur bevæger sig med en hastighed, der gør NVIDIAs årlige chipkadence til den nye taktgiver for hele branchen. Uanset om du arbejder med cloud, on-premise eller edge-computing, er de beslutninger, der træffes i San Jose næste uge, relevante for din teknologistrategi de næste to-tre år.