
La hiérarchie du calcul intensif vient de bouger d’un coup. Avec 2,198 ExaFLOPS soutenus en FP64, LineShine devient le premier système à franchir le cap des 2 ExaFLOPS validés sur charge HPL.
La mise à jour de juin du TOP500 place ainsi la Chine au premier rang, devant El Capitan, Aurora et Frontier. Le point le plus notable tient aussi à son architecture : ce résultat est obtenu sans GPU ni autre accélérateur.
LineShine s’impose au sommet du TOP500
Le système affiche 2,198 ExaFLOPS sur HPL, pour un pic théorique de 2,736 ExaFLOPS. Cela représente environ 80 % de performance soutenue par rapport au maximum théorique, un ratio élevé à cette échelle.
Le TOP500 a validé ces chiffres, ce qui en fait la première entrée chinoise officiellement classée et vérifiée à prendre la première place. Dans un paysage largement tiré par les formats FP8 pour l’IA en datacenter, LineShine rappelle que le HPC scientifique reste ancré sur le FP64.
Pour mesurer le contraste avec les machines dominées par les accélérateurs, il vaut la peine de revoir les GPU Instinct MI200 d’AMD pour le HPC, qui illustrent l’autre grand chemin pris par le calcul intensif.
Une architecture ARMv9 massive sans accélérateurs
LineShine regroupe 13,79 millions de cœurs ARMv9 répartis sur 20 480 nœuds en configuration NUMA. Chaque nœud embarque deux CPU LX2 de 304 cœurs avec 32 Go de mémoire HBM, puis bascule sur de la mémoire système DDR à raison d’environ 256 Go par CPU.
Découpage interne des CPU LX2
Chaque processeur est scindé en deux dies, eux-mêmes divisés en quatre domaines NUMA. Un domaine NUMA intègre 38 cœurs cadencés à 1,55 GHz et dispose de 4 Go de HBM ; quatre domaines constituent un die, associé à 128 Go de DDR, probablement de la DDR5 sans confirmation officielle à ce stade.
La machine consomme 42,2 MW et atteint une efficacité de 52,07 GigaFLOPS par watt. C’est à ce jour le seul système Exascale du TOP500 à reposer exclusivement sur des CPU, là où Fugaku suivait déjà une logique proche, mais autour d’un demi-ExaFLOP soutenu seulement.
Au-delà du symbole, cette première place montre qu’une voie CPU-only reste viable pour le très haut de gamme scientifique, à condition d’accepter une échelle hors norme en nombre de cœurs, en bande passante mémoire et en enveloppe énergétique. C’est aussi un signal industriel fort : la course à l’Exascale ne se joue plus uniquement sur les accélérateurs, mais sur la capacité à intégrer toute la pile système.
Source : TechPowerUp