DeepSeek-R1 : GB200 NVL72 28x Plus Rapide Que MI355X

Graphique comparatif des performances : GPU NVIDIA GB200-DYNAMO, B200-TRT, MI355X-vLLM en throughput.

Il vient de tomber : selon ITHome, dans le benchmark SemiAnalysis InferenceMAX sur le modèle MoE DeepSeek-R1, le système NVIDIA GB200 NVL72 surclasse largement l’AMD Instinct MI355X.

GB200 NVL72 : 75 tokens/s par GPU et x28 de débit

DeepSeek-R1 avec plusieurs GPU NVIDIA GB200 NVL72, circuit imprimé noir, connecteurs, composants visibles, architecture avanc

D’après le rapport Signal65, à configuration de cluster comparable, le GB200 NVL72 atteint 75 tokens/s par GPU, soit environ 28 fois les performances de l’AMD MI355X sur DeepSeek-R1 0528 (MoE). L’architecture « Extreme Co-Design » relie étroitement 72 puces et s’appuie sur 30 To de mémoire partagée pour optimiser les communications all-to-all, goulot critique des modèles MoE.

TCO et positionnement face aux modèles denses

Image comparant les performances des GPU NVIDIA GB200 NVL72 et MI355X, avec des métriques de coûts et de performance.

Basé sur les tarifs Oracle Cloud, Signal65 estime que le coût par token du GB200 NVL72 serait 15 fois inférieur à celui de la solution AMD, tout en offrant une interaction plus rapide. AMD n’est pas hors-jeu pour autant : grâce à sa HBM3e haute capacité, le MI355X reste agressif sur les modèles denses.

Et la suite : Helios vs Vera Rubin

ITHome rappelle qu’AMD n’a pas encore dégainé d’alternative rack-scale face au NVL72. La confrontation entre la plateforme AMD Helios et NVIDIA Vera Rubin pourrait rebattre les cartes au niveau des systèmes de rack.

Source : ITHome