
Il vient de tomber : selon ITHome, dans le benchmark SemiAnalysis InferenceMAX sur le modèle MoE DeepSeek-R1, le système NVIDIA GB200 NVL72 surclasse largement l’AMD Instinct MI355X.
GB200 NVL72 : 75 tokens/s par GPU et x28 de débit

D’après le rapport Signal65, à configuration de cluster comparable, le GB200 NVL72 atteint 75 tokens/s par GPU, soit environ 28 fois les performances de l’AMD MI355X sur DeepSeek-R1 0528 (MoE). L’architecture « Extreme Co-Design » relie étroitement 72 puces et s’appuie sur 30 To de mémoire partagée pour optimiser les communications all-to-all, goulot critique des modèles MoE.
TCO et positionnement face aux modèles denses

Basé sur les tarifs Oracle Cloud, Signal65 estime que le coût par token du GB200 NVL72 serait 15 fois inférieur à celui de la solution AMD, tout en offrant une interaction plus rapide. AMD n’est pas hors-jeu pour autant : grâce à sa HBM3e haute capacité, le MI355X reste agressif sur les modèles denses.
Et la suite : Helios vs Vera Rubin
ITHome rappelle qu’AMD n’a pas encore dégainé d’alternative rack-scale face au NVL72. La confrontation entre la plateforme AMD Helios et NVIDIA Vera Rubin pourrait rebattre les cartes au niveau des systèmes de rack.
Source : ITHome