Intel Gaudi 3 : La puce qui va démocratiser l’IA générative.

Le lancement de l’accélérateur Intel Gaudi 3 marque une étape majeure dans la course à l’IA générative. Dévoilée lors de l’Intel Vision 2024, cette puce promet des performances inédites pour l’entraînement et l’inférence des modèles d’IA générative. Une véritable révolution pour démocratiser ces technologies d’avenir dans des secteurs critiques comme la finance, l’industrie ou la santé.

Une architecture taillée pour la GenAI

Gravée en 5 nm, la puce Gaudi 3 est une concentré de puissance dédié à l’IA. Elle embarque 64 coeurs de processeurs de tenseurs (TPC) programmables spécialement optimisés, épaulés par 8 moteurs de multiplication matricielle (MME). Chaque MME peut réaliser jusqu’à 64 000 opérations en parallèle, un record.

intel gaudi 3 ai accelerator vs gaudi 2

Cette architecture unique, servie par 128 Go de mémoire HBMe2 offrant une bande passante de 3,7 To/s, permet d’exécuter efficacement les calculs d’IA les plus complexes.

gaudi3 proofpoints box r2 rwd.png.rendition.intel .web .1920.1080

Résultat, Gaudi 3 offre jusqu’à 4X plus de puissance en BF16 et 1,5X plus de bande passante mémoire que son prédécesseur Gaudi 2. Idéal pour les grands modèles de langage et multimodaux au coeur de la GenAI.

Caractéristique/ProduitAccélérateur Intel® Gaudi® 2Accélérateur Intel® Gaudi® 3
TFLOPs MME BF164321835
TFLOPs MME FP88651835
TFLOPs Vector BF161128.7
Unités MME28
Unités TPC2464
Capacité HBM96 Go128 Go
Bande passante HBM2,46 To/s3,7 To/s
Capacité SRAM sur puce48 Mo96 Mo
Bande passante SRAM sur puce6,4 To/s12,8 To/s
Réseau600 Go/s bidirectionnel1200 Go/s bidirectionnel
Interface hôtePCIe Gen4 x16PCIe Gen5 x16
Bande passante maximale de l’interface hôte64 Go/s (32 Go/s par direction)128 Go/s (64 Go/s par direction)
Décodeurs médias8 décodeurs14 décodeurs

Intel Gaudi 3 surclasse les processeurs Nvidia H100 & H200

Comparé aux fers de lance de Nvidia, Gaudi 3 fait des étincelles. Face aux H100, il permet un entraînement des modèles Llama 7B/13B et GPT-3 175B 50% plus rapide en moyenne. Sur l’inférence, l’écart est tout aussi impressionnant avec un débit moyen 50% supérieur et une efficacité énergétique 40% meilleure (modèles Llama 7B/70B, Falcon 180B). Un avantage encore plus marqué sur les séquences longues.

gaudi3 vs nvidia performance rwd.png.rendition.intel .web .1920.1080

Même face au dernier-né H200 de Nvidia, Gaudi 3 garde l’avantage avec une vitesse d’inférence jusqu’à 30% supérieure. Et pour cause, la puce d’Intel est conçue de A à Z pour l’IA, là où les processeurs Nvidia restent des GPU plus généralistes.

Un écosystème ouvert et évolutif

Au delà de sa puissance brute, la plateforme Gaudi 3 mise sur l’ouverture. Ses accélérateurs communiquent via un réseau Ethernet standard, permettant de créer des clusters de calcul de plusieurs milliers de noeuds. Une scalabilité bien plus flexible que les réseaux propriétaires des concurrents.

newsroom intel gaudi 3 03

Côté logiciel, Gaudi 3 supporte les frameworks et modèles les plus populaires comme PyTorch ou ceux de Hugging Face. De quoi faciliter la tâche des développeurs. Un écosystème orchestré avec des partenaires de renom comme Dell, HPE ou Lenovo pour intégrer Gaudi 3 dans leurs serveurs.

Vers une démocratisation de la GenAI

Disponible auprès des OEM au 3e trimestre 2024, Gaudi 3 aura un impact majeur sur le marché de la GenAI. D’autant que son architecture sera également intégrée aux futurs GPU Falcon Shores d’Intel, offrant une plateforme unifiée pour l’IA, des centres de données jusqu’à nos PC.

intel gaudi 3 rendition

En bousculant l’hégémonie de Nvidia, Intel rend l’IA générative plus accessible et performante, accélérant son adoption par les entreprises. Avec un temps de mise sur le marché et un coût total de possession optimisés, la génération Gaudi 3 a tous les atouts pour devenir une plateforme de choix pour démocratiser la GenAI à grande échelle, au service d’une innovation plus rapide et efficace.

Conclusion

Le lancement du Gaudi 3 ne marque pas seulement une nouvelle étape pour Intel, mais redéfinit les standards de l’industrie pour les accélérateurs d’IA générative. Avec ce bond en avant sur les performances, l’efficacité et la scalabilité, Intel pose les fondations d’un écosystème matériel et logiciel ouvert pour rendre cette technologie d’avenir plus accessible aux entreprises.

Un changement de paradigme qui va permettre à la GenAI de passer plus rapidement du stade expérimental à un déploiement industriel, au service de cas d’usage critiques. Finance, santé, industrie… Aucun secteur n’échappera à cette vague d’IA générative qui s’annonce, avec Intel Gaudi 3 comme fer de lance. Reste désormais à transformer l’essai en accélérant la mise sur le marché de ces solutions. La bataille de l’IA générative ne fait que commencer, mais Intel a déjà pris une sérieuse option pour en être l’un des leaders.

NB : Intel va lancer Gaudi 3 HL-328 et HL-388 qui seront deux accélérateurs IA spécifiques pour la Chine

Source
www.intel.com

Wael.K

Ravi de vous accueillir sur ma page dédiée aux articles ! Je suis Wael El Kadri, et je suis un ingénieur civil de profession. Mais ma véritable passion est le matériel informatique. J'en suis passionné depuis l'âge de 12 ans, et j'aime apprendre et découvrir de nouvelles choses. En 2016, j'ai créé ma page personnelle sur les réseaux sociaux, baptisée Pause Hardware. C'est là que je partage mes créations en modding, mais aussi divers sujets liés au matériel informatique en général. J'ai également crée le site web, pausehardware.com, en 2019 où je publie des articles plus approfondis sur le matériel à travers des tests et revues et articles de news. J'ai eu l'opportunité de participer en tant qu'exposant à plusieurs événements liés aux jeux vidéo, aux côtés de grandes marques, notamment lors de la Paris Game Week en 2018 et 2019. Je reste constamment en quête de nouvelles manières de partager mes connaissances et ma passion pour le matériel informatique avec d'autres passionnés. Voici quelques publications médiatiques qui ont mis en lumière mon travail : Deux articles dans le magazine Extreme PC, parus dans ses  numéros 1 et 21 : Extreme PC Magazine Issue 21 (adobe.com) Également, un article sur Forbes intitulé "Dix Modèles de PC Incroyables en 2021" sur forbes.com : Ten Incredible PC Mods Of 2021 (forbes.com)

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page