NVIDIA Rubin NVL72 : 72 GPU, 36 CPU et 260 TB/s, la plateforme IA se précise

NVIDIA Rubin s’avance plus vite que prévu : à l’occasion du CES 2026, la firme détaille la pile data center autour de sa nouvelle génération GPU et CPU, avec le rack Vera Rubin NVL72 en tête d’affiche.

NVIDIA Rubin NVL72 en détails

Au cœur de l’offre, le GPU Rubin revendique 336 milliards de transistors et une conception à deux dies de réticule. Les chiffres avancés montent jusqu’à 50 PFLOPS en NVFP4 pour l’inférence et 35 PFLOPS en NVFP4 pour l’entraînement, soit, d’après NVIDIA, des gains d’un facteur 5 et 3,5 face à Blackwell. La mémoire passe en HBM4, jusqu’à 288 Go par GPU pour une bande passante cumulée pouvant atteindre 22 TB/s.

Présentation des chipsets NVIDIA Rubin, y compris Vera, Rubin et GPU EX65.

Côté CPU, Rubin s’adosse au processeur Vera, 227 milliards de transistors, basé sur des cœurs Arm « Olympus » conçus par NVIDIA. Le Vera aligne 88 cœurs et 176 threads via Spatial Multi-Threading, jusqu’à 1,5 To de LPDDR5x (SOCAMM) et 1,2 TB/s de bande passante mémoire. La cohérence NVLink-C2C grimpe à 1,8 TB/s. NVIDIA évoque des gains doublés en traitement de données, compression et CI/CD face à Grace.

Spécifications NVIDIA Vera Rubin NVL72 avec détails sur les performances AI et capacité.

Pour le scale-up, NVLink 6 annonce 3,6 TB/s de bande passante bidirectionnelle par GPU et 260 TB/s à l’échelle du rack NVL72. Le switch NVLink 6 s’intègre au tissu de calcul avec 28,8 TB/s de bande passante totale et jusqu’à 14,4 TFLOPS FP8 de compute réseau par tiroir de switch. Pour le scale-out, ConnectX-9 et BlueField-4 prennent le relais : jusqu’à 1,6 Tb/s par GPU Rubin pour le premier, et 800 Gb/s côté DPU pour le second. Le volet Ethernet photonics s’appuie sur Spectrum-6 et un backbone à 102,4 Tb/s avec optiques co-intégrées.

Vera Rubin NVL72 : chiffres clés et efficacité annoncée

La configuration phare, Vera Rubin NVL72, agrège 72 GPU Rubin et 36 CPU Vera via NVLink 6. NVIDIA avance 3,6 EFLOPS en NVFP4 pour l’inférence et 2,5 EFLOPS pour l’entraînement, complétés par 20,7 To de HBM4 et 54 To de LPDDR5x, pour une bande passante HBM cumulée de 1,6 PB/s. Sur l’efficacité, la société lie Rubin à de fortes baisses des coûts IA : jusqu’à 10x de réduction du coût par token en inférence et 4x moins de GPU pour l’entraînement MoE par rapport à Blackwell. Un support de présentation situe aussi l’inférence MoE à environ un septième du coût par token face à GB200.

La disponibilité s’accélère : NVIDIA indique une production complète dès le premier trimestre 2026, alors que les indications précédentes tablaient sur un volume au second semestre 2026. Les partenaires resteraient servis au second semestre 2026, avec des déploiements début 2026 chez AWS, Google Cloud, Microsoft et Oracle Cloud, ainsi que via des NVIDIA Cloud Partners comme CoreWeave, Lambda, Nebius et Nscale. « Rubin est déjà en production en Q1 2026 », affirme NVIDIA.

Source : NVIDIA

Wael.K

Ravi de vous accueillir sur ma page dédiée aux articles ! Je suis Wael El Kadri, et je suis un ingénieur civil de profession. Mais ma véritable passion est le matériel informatique. J'en suis passionné depuis l'âge de 12 ans, et j'aime apprendre et découvrir de nouvelles choses. En 2016, j'ai créé ma page personnelle sur les réseaux sociaux, baptisée Pause Hardware. C'est là que je partage mes créations en modding, mais aussi divers sujets liés au matériel informatique en général. J'ai également crée le site web, pausehardware.com, en 2019 où je publie des articles plus approfondis sur le matériel à travers des tests et revues et articles de news. J'ai eu l'opportunité de participer en tant qu'exposant à plusieurs événements liés aux jeux vidéo, aux côtés de grandes marques, notamment lors de la Paris Game Week en 2018 et 2019. Je reste constamment en quête de nouvelles manières de partager mes connaissances et ma passion pour le matériel informatique avec d'autres passionnés. Voici quelques publications médiatiques qui ont mis en lumière mon travail : Deux articles dans le magazine Extreme PC, parus dans ses  numéros 1 et 21 : Extreme PC Magazine Issue 21 (adobe.com) Également, un article sur Forbes intitulé "Dix Modèles de PC Incroyables en 2021" sur forbes.com : Ten Incredible PC Mods Of 2021 (forbes.com)
guest
0 Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
Bouton retour en haut de la page
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x