NVIDIA Vera Rubin doorbreekt de GPU-vorm met 600-kilowatt racks en miljoen-token geheugens
Jensen Huang, CEO van NVIDIA, liet tijdens de GTC 2025 een bom vallen die infrastructuurteams naar hun rekenmachines deed grijpen: het Vera Rubin-platform zal datacenterracks tegen 2027 naar 600 kilowatt duwen.¹ De aankondiging markeert een fundamentele verschuiving in de manier waarop datacenters werken en dwingt tot een volledige heroverweging van de stroomvoorziening, koelsystemen en fysieke infrastructuur die decennialang in wezen ongewijzigd is gebleven.
Het Vera Rubin-platform vertegenwoordigt NVIDIA's meest ambitieuze sprong tot nu toe. Dit uit meerdere componenten bestaande systeem combineert de op maat gemaakte Vera CPU, de Rubin GPU van de volgende generatie en de gespecialiseerde Rubin CPX (Context Processing eXtension) versneller, die speciaal is ontworpen voor AI-workloads met miljoenen tekens.² In tegenstelling tot de incrementele verbeteringen die kenmerkend zijn voor GPU-generaties, levert de Vera Rubin NVL144 CPX variant 7,5x de AI-prestaties van de huidige Blackwell GB300 systemen, terwijl de manier waarop GPU's worden verpakt, gekoeld en ingezet fundamenteel wordt veranderd.³
"We zijn het eerste technologiebedrijf in de geschiedenis dat vier generaties van iets heeft aangekondigd", legde Huang uit aan Data Center Dynamics, waarbij hij NVIDIA's stappenplan tot 2028 uiteenzette. De transparantie dient een cruciaal doel: infrastructuurleveranciers, datacenterbeheerders en bedrijven als Introl de tijd geven om zich voor te bereiden op wat neerkomt op een volledige herdefiniëring van AI-infrastructuur.
NVIDIA Vera Rubin NVL144 platform specificaties tonen 3,6 exaflops FP4 inferentie prestaties en 3,3x verbetering ten opzichte van GB300 NVL72, aankomst tweede helft 2026.
De architectuurrevolutie begint met silicium op maat.
NVIDIA's complete stappenplan van Blackwell tot Feynman, die de evolutie laat zien van Oberon tot Kyber rack-architecturen die tot 600kW stroomverbruik ondersteunen.
Met de Vera CPU wijkt NVIDIA af van kant-en-klare ARM-ontwerpen, met 88 eigen ARM-kernen met gelijktijdige multithreading, waardoor 176 logische processors mogelijk zijn.NVIDIA noemt de aangepaste kernen "Olympus" en het ontwerp levert twee keer zoveel prestaties als de Grace CPU die wordt gebruikt in de huidige Blackwell systemen.⁶ Elke Vera CPU maakt verbinding met Rubin GPU's via een 1,8 TB/s NVLink C2C interface, wat ongekende bandbreedte tussen rekenelementen mogelijk maakt.⁷
De standaard Rubin GPU verlegt grenzen met 288GB HBM4-geheugen per pakket, met behoud van dezelfde capaciteit als de Blackwell Ultra B300, maar met een toename van 8 TB/s naar 13 TB/s geheugenbandbreedte.⁸ Elk Rubin-pakket bevat twee GPU-matrijzen met reticle-limited, hoewel NVIDIA haar telmethode heeft gewijzigd: wat Blackwell één GPU (twee matrijzen) noemde, noemt Rubin twee GPU's. ⁹ De wijziging weerspiegelt de toenemende complexiteit van multi-matrixarchitecturen en helpt klanten een beter inzicht te krijgen in de werkelijke rekenbronnen in elk systeem.
Het meest innovatieve element komt in de vorm van Rubin CPX, een speciaal gebouwde versneller voor verwerking van massieve contexten. Het monolithische ontwerp levert 30 petaFLOPs NVFP4 compute met 128 GB kostenefficiënt GDDR7-geheugen, specifiek geoptimaliseerd voor aandachtsmechanismen in transformatormodellen.¹⁰ De CPX bereikt 3x snellere aandachtsmogelijkheden in vergelijking met GB300 NVL72-systemen, waardoor AI-modellen contexten van miljoenen tokens kunnen verwerken - gelijk aan een uur video of volledige codebases - zonder prestatieverlies.¹¹
Implementatie vereist een volledige herziening van de infrastructuur.
Het standaard Vera Rubin NVL144 systeem, dat gepland staat voor de tweede helft van 2026, blijft compatibel met de bestaande GB200/GB300 infrastructuur en maakt gebruik van de vertrouwde Oberon rack-architectuur.¹² Het systeem bevat 144 GPU dies (72 pakketten), 36 Vera CPU's en levert 3,6 exaFLOPS FP4 inferentieprestaties-een 3,3x betere prestatie dan Blackwell Ultra.¹³ Het stroomverbruik blijft beheersbaar met ongeveer 120-130kW per rack, vergelijkbaar met de huidige implementaties.
De Vera Rubin NVL144 CPX variant gaat nog een stap verder en integreert 144 Rubin CPX GPU's naast 144 standaard Rubin GPU's en 36 Vera CPU's om acht exaFLOPs aan NVFP4 compute te leveren - een 7,5x verbetering ten opzichte van GB300 NVL72 - met 100TB aan high-speed geheugen en 1,7 PB/s aan geheugenbandbreedte in één rack.¹⁴
Alles verandert met Rubin Ultra en de Kyber-rackarchitectuur in 2027. Het NVL576 systeem propt 576 GPU dies in een enkel rack en verbruikt 600kW aan stroom - vijf keer zoveel als de huidige systemen.¹⁵ Het Kyber ontwerp draait compute blades 90 graden in een verticale oriëntatie, waardoor vier pods van elk 18 blades in het rack worden geplaatst.¹⁶ Elke blade bevat acht Rubin Ultra GPU's naast Vera CPU's, waardoor dichtheden worden bereikt die jaren geleden nog onmogelijk leken.
Huidig NVIDIA Blackwell-systeem met 72 GPU's levert 1,1 exaflops
Toekomstig NVIDIA Rubin-systeem schaalbaar tot 576 GPU's en 15 exaflops in één rack van 600kW
Voor de koeling van deze systemen is een volledige onderdompeling in vloeistof nodig, zonder ventilatoren - een verschil met de huidige systemen, die nog steeds enige luchtkoeling gebruiken voor hulpcomponenten.¹⁷ CoolIT Systems en Accelsius hebben al koeloplossingen gedemonstreerd die in staat zijn racks van 250kW met watertemperaturen van 40°C aan te kunnen, waarmee het technologische pad naar de inzet van 600kW wordt gevalideerd.¹⁸ Het Kyber-rack bevat een speciale zijspan voor de stroom- en koelinfrastructuur, waardoor er effectief twee rack footprints nodig zijn voor elk 600kW-systeem.¹⁹
De evolutie van de vermogensarchitectuur maakt computergebruik op megawattschaal mogelijk.
NVIDIA's overgang naar 800 VDC stroomdistributie pakt fundamentele fysische beperkingen van de huidige infrastructuur aan. Traditionele 54V in-rack distributie zou 64U aan voedingsrekken vereisen voor Kyber-scale systemen, waardoor er geen ruimte overblijft voor daadwerkelijke computing.²⁰ De 800V architectuur elimineert AC/DC conversie op rackniveau, verbetert de end-to-end efficiëntie met maximaal 5% en verlaagt de onderhoudskosten met maximaal 70%.²¹
De nieuwe voedingsinfrastructuur ondersteunt racks van 100kW tot meer dan 1MW, met gebruik van dezelfde backbone, en biedt de schaalbaarheid die nodig is voor toekomstige generaties.²² Bedrijven die Vera Rubin implementeren moeten rekening houden met enorme elektrische upgrades-een enkel NVL576 rack verbruikt evenveel stroom als 400 doorsnee huizen. Datacenters die plannen maken voor installaties in 2027 moeten nu al beginnen met infrastructuurupgrades, inclusief stroomaansluitingen op nutsschaal en mogelijk opwekking op locatie.
Voor infrastructuurspecialisten als Introl creëert deze verschuiving ongekende mogelijkheden. De expertise van het bedrijf in het inzetten van GPU-infrastructuur op hyperscale, het beheren van meer dan 100.000 GPU's wereldwijd, en zijn uitgebreide APAC-aanwezigheid organisaties hebben partners nodig die niet alleen inzicht hebben in de inzet van GPU's, maar ook in de ingewikkelde dans van stroom, koeling en netwerken die nodig zijn voor systemen van 600kW.
Prestatiewinst rechtvaardigt investering in infrastructuur.
De Vera Rubin NVL144 CPX-variant laat het potentieel van het platform zien met acht exaFLOPS NVFP4 compute, naast 100 TB high-speed geheugen en 1,7 PB/s geheugenbandbreedte, allemaal in één rack.²⁴ NVIDIA claimt dat organisaties 30x tot 50x rendement op investering kunnen behalen, wat zich vertaalt in $5 miljard aan inkomsten uit een kapitaalinvestering van $100 miljoen.²⁵
Tot de early adopters behoort het Duitse Leibniz Supercomputing Center, dat de Blue Lion supercomputer inzet met Vera Rubin om 30 keer meer rekenkracht te bereiken dan hun huidige systeem.²⁶ Het Doudna-systeem van Lawrence Berkeley National Lab zal ook draaien op Vera Rubin, waardoor simulatie, data en AI worden gecombineerd in één enkel platform voor wetenschappelijke computing.²⁷
De specialisatie van de Rubin CPX voor contextverwerking pakt een kritisch knelpunt aan in de huidige AI-systemen. Bedrijven als Cursor, Runway en Magic zijn al aan het onderzoeken hoe CPX coderende assistenten en toepassingen voor het genereren van video's, die miljoenen tokens tegelijk moeten verwerken, kan versnellen.²⁸ De mogelijkheid om hele codebases of uren aan video in het actieve geheugen te bewaren, verandert fundamenteel wat AI-toepassingen kunnen bereiken.
Infrastructurele uitdagingen creëren marktkansen.
De sprong naar 600kW racks legt een harde realiteit bloot over de huidige mogelijkheden van datacenters. De meeste faciliteiten worstelen met racks van 40kW; zelfs geavanceerde AI-datacenters komen zelden boven de 120kW uit. De overgang vereist niet alleen nieuwe koelsystemen, maar ook een compleet herontwerp van de faciliteiten, van betonnen vloeren die enorme gewichtslasten kunnen dragen tot elektrische substations die geschikt zijn voor industriële toepassingen.
"De vraag blijft hoeveel bestaande datacenterfaciliteiten zo'n dichte configuratie zullen kunnen ondersteunen," merkt The Register op, benadrukkend dat de op maat gemaakte aard van Kyber-racks betekent dat faciliteiten speciaal gebouwde infrastructuur nodig hebben.²⁹ Greenfield-ontwikkelingen in regio's met een overschot aan hernieuwbare of nucleaire energie - Scandinavië, Quebec en de VAE - zullen waarschijnlijk leiden tot adoptie.³⁰
De tijdlijn geeft de industrie ademruimte, maar vereist onmiddellijke actie. Organisaties die AI-infrastructuur plannen voor 2027 en daarna moeten nu beslissingen nemen over de locatie van faciliteiten, de inkoop van energie en de koelarchitectuur. De aanlooptijd van drie jaar weerspiegelt de complexiteit van het implementeren van infrastructuur die werkt op de grens van wat fysiek mogelijk is.
De weg voorbij Vera Rubin
NVIDIA's routekaart reikt verder dan Vera Rubin tot de Feynman architectuur in 2028, en gaat waarschijnlijk in de richting van 1-megawatt racks.³¹ Giordano Albertazzi, CEO van Vertiv, suggereert dat het bereiken van MW-schaal dichtheid "een verdere revolutie in de vloeistofkoeling en een paradigmaverandering aan de stroomzijde" zal vereisen.
De verschuiving van incrementele verbeteringen naar revolutionaire veranderingen in GPU-infrastructuur weerspiegelt de bredere AI-transformatie. Net zoals grote taalmodellen een sprong maakten van miljarden naar triljoenen parameters, moet de infrastructuur die ze ondersteunt vergelijkbare sprongen maken. Vera Rubin staat niet alleen voor snellere GPU's, maar ook voor een fundamentele heroverweging van hoe rekeninfrastructuur werkt.
Voor bedrijven zoals Introl, die gespecialiseerd zijn in het implementeren van GPU-infrastructuur, creëert Vera Rubin een generatieopportuniteit. Organisaties hebben partners nodig die kunnen navigeren door de complexiteit van 600kW implementaties, van de initiële planning tot de implementatie en voortdurende optimalisatie. De bedrijven die Vera Rubin met succes implementeren, zullen aanzienlijke concurrentievoordelen behalen op het gebied van AI-mogelijkheden, terwijl bedrijven die aarzelen het risico lopen om het onderspit te delven terwijl de industrie racet in de richting van exascale AI.
Conclusie
Het Vera Rubin-platform van NVIDIA dwingt de datacenterindustrie om ongemakkelijke waarheden over infrastructuurbeperkingen onder ogen te zien, terwijl het ongekende rekencapaciteiten biedt. De 600kW racks van 2027 vertegenwoordigen meer dan alleen een hoger stroomverbruik - ze markeren een complete transformatie in hoe AI-infrastructuur wordt gebouwd, gekoeld en bediend. Organisaties die nu beginnen met plannen en samenwerken met ervaren infrastructuurspecialisten die de complexiteit van implementaties van de volgende generatie begrijpen, zullen zich in de beste positie bevinden om de revolutionaire mogelijkheden te benutten die Vera Rubin mogelijk maakt.
De komst van het platform in 2026-2027 geeft de industrie de tijd om zich voor te bereiden, maar de klok tikt door. Datacenters die vandaag worden ontworpen, moeten anticiperen op de vereisten van morgen en Vera Rubin maakt duidelijk dat morgen radicaal moet worden afgeweken van het conventionele denken. De bedrijven die deze transformatie omarmen, zullen de volgende generatie AI-doorbraken aandrijven, van taalmodellen die miljoenen tokens bevatten tot realtime systemen voor het genereren van video's die nu nog sciencefiction lijken.
Referenties
¹ The Register. "Nvidia's Vera Rubin CPU, GPU's zetten koers uit naar 600kW racks." 19 maart 2025. https://www.theregister.com/2025/03/19/nvidia_charts_course_for_600kw.
² NVIDIA Newsroom. "NVIDIA onthult Rubin CPX: een nieuwe GPU-klasse ontworpen voor Massive-Context Inference." 2025. https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference.
³ Ibid.
Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck en Charlie Boyle over de toekomst van datacenterdichtheid in rekken." 21 maart 2025. https://www.datacenterdynamics.com/en/analysis/nvidia-gtc-jensen-huang-data-center-rack-density/.
TechPowerUp. "NVIDIA onthult Vera CPU en Rubin Ultra AI GPU, kondigt Feynman Architecture aan." 2025. https://www.techpowerup.com/334334/nvidia-unveils-vera-cpu-and-rubin-ultra-ai-gpu-announces-feynman-architecture.
CNBC. "Nvidia kondigt Blackwell Ultra en Vera Rubin AI-chips aan." 18 maart 2025. https://www.cnbc.com/2025/03/18/nvidia-announces-blackwell-ultra-and-vera-rubin-ai-chips-.html.
Yahoo Finance. "Nvidia debuteert volgende generatie Vera Rubin superchip op GTC 2025." 18 maart 2025. https://finance.yahoo.com/news/nvidia-debuts-next-generation-vera-rubin-superchip-at-gtc-2025-184305222.html.
Volgend platform. "Nvidia tekent GPU-systeem roadmap tot 2028." 5 juni 2025. https://www.nextplatform.com/2025/03/19/nvidia-draws-gpu-system-roadmap-out-to-2028/.
Semi-analyse. "NVIDIA GTC 2025 - Built For Reasoning, Vera Rubin, Kyber, CPO, Dynamo Inference, Jensen Math, Feynman." 4 augustus 2025. https://semianalysis.com/2025/03/19/nvidia-gtc-2025-built-for-reasoning-vera-rubin-kyber-cpo-dynamo-inference-jensen-math-feynman/.
¹⁰ NVIDIA Newsroom. "NVIDIA onthult Rubin CPX: een nieuwe GPU-klasse ontworpen voor Massive-Context Inference."
¹¹ Ibid.
¹² Tom's Hardware. "Nvidia kondigt Rubin GPU's aan in 2026, Rubin Ultra in 2027, Feynman ook toegevoegd aan roadmap." 18 maart 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-announces-rubin-gpus-in-2026-rubin-ultra-in-2027-feynam-after.
¹³ The New Stack. "NVIDIA onthult volgende-generatie Rubin- en Feynman-architecturen, die AI-krachtgrenzen verleggen." 14 april 2025. https://thenewstack.io/nvidia-unveils-next-gen-rubin-and-feynman-architectures-pushing-ai-power-limits/.
¹⁴ NVIDIA Newsroom. "NVIDIA onthult Rubin CPX: een nieuwe klasse GPU ontworpen voor Massive-Context Inference."
¹⁵ Data Center Dynamics. "Nvidia's Rubin Ultra NVL576 rack naar verwachting 600kW, komt tweede helft van 2027." 18 maart 2025. https://www.datacenterdynamics.com/en/news/nvidias-rubin-ultra-nvl576-rack-expected-to-be-600kw-coming-second-half-of-2027/.
Tom's Hardware. "Nvidia toont Rubin Ultra met 600.000-Watt Kyber-racks en infrastructuur, komt in 2027." 19 maart 2025. https://www.tomshardware.com/pc-components/gpus/nvidia-shows-off-rubin-ultra-with-600-000-watt-kyber-racks-and-infrastructure-coming-in-2027.
¹⁷ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck en Charlie Boyle over de toekomst van datacenterdichtheid in racks."
¹⁸ Data Center Frontier. "CoolIT en Accelsius verleggen grenzen datacenters voor vloeistofkoeling temidden van stijgende Rack-dichtheden." 2025. https://www.datacenterfrontier.com/cooling/article/55281394/coolit-and-accelsius-push-data-center-liquid-cooling-limits-amid-soaring-rack-densities.
¹⁹ Data Center Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck en Charlie Boyle over de toekomst van datacenterdichtheid in racks."
²⁰ NVIDIA Technical Blog. "NVIDIA 800 VDC-architectuur zal de volgende generatie AI-fabrieken aandrijven." 20 mei 2025. https://developer.nvidia.com/blog/nvidia-800-v-hvdc-architecture-will-power-the-next-generation-of-ai-factories/.
²¹ Ibid.
²² Ibid.
²³ Introl. "Dekkingsgebied." Toegang 2025. https://introl.com/coverage-area.
²⁴ NVIDIA Newsroom. "NVIDIA onthult Rubin CPX: een nieuwe GPU-klasse ontworpen voor Massive-Context Inference."
²⁵ Ibid.
²⁶ NVIDIA Blog. "Supercomputer Blue Lion draait op NVIDIA Vera Rubin." 10 juni 2025. https://blogs.nvidia.com/blog/blue-lion-vera-rubin/.
²⁷ Ibid.
²⁸ NVIDIA Newsroom. "NVIDIA onthult Rubin CPX: een nieuwe GPU-klasse ontworpen voor Massive-Context Inference."
²⁹ The Register. "Nvidia's Vera Rubin CPU, GPU's zetten koers uit naar 600kW racks."
Global Data Center Hub. "Nvidia's 600kW Racks zijn hier (is uw infrastructuur er klaar voor?)." 23 maart 2025. https://www.globaldatacenterhub.com/p/issue-8-nvidias-600kw-racks-are-hereis.
³¹ TechPowerUp. "NVIDIA onthult Vera CPU en Rubin Ultra AI GPU, kondigt Feynman Architecture aan."
³² Datacenter Dynamics. "GTC: Nvidia's Jensen Huang, Ian Buck en Charlie Boyle over de toekomst van datacenterdichtheid in racks."