Qualcomm Dragonfly : CPU C1000, AI300 et feuille de route IA jusqu’en 2028

Le mobile n’est plus le seul terrain de jeu de Qualcomm. Avec une feuille de route datacenter désormais balisée jusqu’en 2028, le groupe veut se placer là où la facture énergétique et le débit de tokens dictent déjà les choix d’infrastructure.

Qualcomm Dragonfly s’étend du CPU à l’inférence rack-scale

Lors de son Investor Day, Qualcomm Technologies a dévoilé une gamme complète pour le datacenter : le CPU Qualcomm Dragonfly C1000, l’architecture mémoire et calcul Qualcomm High Bandwidth Compute ou HBC, l’accélérateur d’inférence Qualcomm Dragonfly AI300, des produits de connectivité, ainsi qu’une offre de custom silicon. L’ensemble est présenté comme une pile complète orientée IA, avec un accent clair sur la performance par watt, le débit de tokens et le coût total de possession.

Visuel Qualcomm Dragonfly avec châssis serveur beige et logo Dragonfly sur fond blanc

Qualcomm positionne cette offensive sur la montée des charges d’agentic AI, qui augmentent fortement la demande en inférence dans les centres de données. Cristiano Amon, président et CEO de Qualcomm Incorporated, estime que cette bascule favorise directement les acteurs capables de livrer plus de performances à puissance et coût réduits, et évoque déjà des accords pluriannuels et multi-générations avec de grands clients.

Tony Pialis, EVP et GM Data Center chez Qualcomm Technologies, met de son côté l’accent sur l’orchestration de plusieurs types de calcul dans une infrastructure distribuée et toujours active. Le discours est classique sur le fond, mais la proposition est plus large qu’un simple accélérateur IA : CPU, mémoire, interconnexions et intégration rack-scale sont pensés ensemble.

C1000, HBC et AI300 : les points techniques à retenir

Un CPU serveur Oryon à plus de 250 cœurs

Le Qualcomm Dragonfly C1000 est un CPU datacenter conçu pour les charges agentiques, généralistes et les nœuds hôtes IA. Qualcomm y intègre des cœurs Oryon maison, optimisés pour les performances par cœur et des fréquences supérieures à 5 GHz. La puce adopte un design chiplet de plus de 250 cœurs, avec un objectif de débit élevé sans sacrifier les performances unitaires.

Qualcomm avance une estimation de plus de 2x en performance par watt face à des offres CPU serveur concurrentes actuelles, sur la base des spécifications. Le C1000 vise aussi plus de 2 To/s de connectivité PCIe Gen 7, avec prise en charge de CXL pour les accélérateurs, le réseau haut débit, le stockage et la désagrégation mémoire. Le sous-système mémoire est annoncé comme optimisé pour la bande passante, la capacité, la latence et l’efficacité énergétique via une mémoire basse consommation de dernière génération.

Rangée de racks serveur avec logo Qualcomm Dragonfly AI300 dans un datacenter

Le CPU pourra assurer de l’inférence sur CPU avec un attachement optionnel au HBC. Qualcomm mentionne aussi des fonctions RAS avancées, dont ECC, isolation des fautes et récupération d’erreurs, ainsi qu’une compatibilité avec le refroidissement à air et liquide dans des racks et serveurs OCP ORv3. Trois déclinaisons sont prévues : CPU agentique, CPU généraliste et CPU pour head node IA. La disponibilité commerciale est attendue en 2028.

HBC mise sur la mémoire proche du calcul

Le Qualcomm High Bandwidth Compute repose sur une architecture de calcul proche mémoire, avec une solution silicium 3D-stacked qui associe calcul et bande passante mémoire accélérée. L’objectif est clair : attaquer le goulet d’étranglement du déplacement des données, qui pèse de plus en plus sur l’inférence IA.

Sur le papier, HBC Gen 1 doit permettre à l’AI250 d’atteindre 133 To/s par carte, soit une hausse de 18x de la bande passante mémoire effective face à l’AI200 en LPDDR5X. L’AI300, avec HBC Gen 2, est annoncé avec un gain de 54x par rapport à l’AI200. Qualcomm ajoute une promesse de 6x plus de bande passante par watt que la HBM, à spécifications publiées concurrentes normalisées au niveau carte, et de 200x plus de capacité par watt que la SRAM, cette fois normalisée au niveau rack. L’échantillonnage commercial de HBC Gen 1 avec l’AI250 est prévu pour mi-2027.

Le Qualcomm Dragonfly AI300 représente la troisième génération de plateforme d’inférence IA au niveau carte et rack, après les AI200 et AI250 dévoilés en octobre dernier. Cette version est compatible avec le refroidissement par air ou liquide direct et intègre HBC Gen 2 pour augmenter capacité mémoire et bande passante effective, avec en ligne de mire les déploiements d’inférence désagrégés pour LLM, LMM et charges agentiques.

Qualcomm évoque ici un gain attendu de 4x à 8x en performance par watt face aux architectures GPU existantes, sur la métrique de bande passante mémoire par watt au niveau carte. La montée en échelle passe par UALink et ESUN pour le scale-up, ainsi que par des liaisons cuivre et optiques pour le scale-out. L’échantillonnage commercial de l’AI300 est attendu en 2028.

Meta déjà signé, plus de 35 partenaires affichés

Au-delà des puces, Qualcomm veut montrer qu’il ne débarque pas seul. Le groupe a annoncé un accord stratégique multi-générations avec Meta, qui prévoit d’utiliser le Qualcomm Dragonfly C1000 dans sa prochaine flotte de serveurs. Pour Qualcomm, c’est le signal le plus important de cette présentation : la société n’expose pas seulement une roadmap, elle affiche déjà un premier client hyperscale de poids.

La société cite aussi le soutien de plus de 35 acteurs de l’écosystème, dont Advantest, Arista, Astera, Cirrascale, Compal, Confidential Core AI, Core42, Delta, Fibercop, Foxconn, GIGABYTE Technology, HUMAIN, Inventec, IONOS, Lenovo, Master Works, Microchip Technology, Micron Technology, Nanya Technology, NEC, NeuReality, Quanta, Pegatron Corporation, Samsung SDS, Saptiva AI, SK hynix America, Supermicro, Teradyne, TeraHop, UMC, VAST Data, Viettel IDC, VNPT Group et Wistron.

La partie connectivité couvre les interconnexions die-to-die, cuivre, optiques et campus, avec prise en charge du 800G et du 1.6T sur des applications optiques, AOC et AEC, jusqu’à 20 km. Qualcomm met en avant ses briques SerDes, PAM4, coherent-lite DSP, intégrité du signal et télémétrie pour répondre aux besoins des infrastructures IA distribuées et désagrégées.

Le point le plus intéressant reste la cohérence de l’ensemble. Qualcomm ne vise pas frontalement le calcul d’entraînement massif, mais l’inférence à grande échelle, là où la contrainte énergétique, la bande passante mémoire et l’utilisation réelle des racks commencent à peser davantage que la seule puissance brute. Si les chiffres avancés sur HBC et sur le rendement par watt se confirment, la fenêtre existe face aux GPU généralistes, surtout chez les hyperscalers capables d’absorber une nouvelle architecture sur plusieurs générations.

Source : TechPowerUp

Wael.K

Ravi de vous accueillir sur ma page dédiée aux articles ! Je suis Wael El Kadri, et je suis un ingénieur civil de profession. Mais ma véritable passion est le matériel informatique. J'en suis passionné depuis l'âge de 12 ans, et j'aime apprendre et découvrir de nouvelles choses. En 2016, j'ai créé ma page personnelle sur les réseaux sociaux, baptisée Pause Hardware. C'est là que je partage mes créations en modding, mais aussi divers sujets liés au matériel informatique en général. J'ai également crée le site web, pausehardware.com, en 2019 où je publie des articles plus approfondis sur le matériel à travers des tests et revues et articles de news. J'ai eu l'opportunité de participer en tant qu'exposant à plusieurs événements liés aux jeux vidéo, aux côtés de grandes marques, notamment lors de la Paris Game Week en 2018 et 2019. Je reste constamment en quête de nouvelles manières de partager mes connaissances et ma passion pour le matériel informatique avec d'autres passionnés. Voici quelques publications médiatiques qui ont mis en lumière mon travail : Deux articles dans le magazine Extreme PC, parus dans ses  numéros 1 et 21 : Extreme PC Magazine Issue 21 (adobe.com) Également, un article sur Forbes intitulé "Dix Modèles de PC Incroyables en 2021" sur forbes.com : Ten Incredible PC Mods Of 2021 (forbes.com)
guest
0 Commentaires
Le plus ancien
Le plus récent Le plus populaire
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x