
Le coréen DEEPX a annoncé viser la production de masse en 2027 de sa puce DX-M2, gravée par Samsung Foundry en 2 nm. L’entreprise présente ce modèle comme un accélérateur d’IA à très basse consommation, avec un objectif chiffré de 80 TOPS pour une enveloppe de 5 W.
Au-delà de cette cible, DEEPX affiche une ambition claire : permettre l’exécution locale de modèles génératifs de plusieurs dizaines à centaines de milliards de paramètres sur des appareils alimentés sur batterie. Le positionnement vise donc des terminaux edge contraints en énergie, où le ratio performance/watt prime sur le pic de calcul absolu.
Feuille de route et pile logicielle
DEEPX accompagne le matériel d’une stratégie logicielle centrée sur DXNN, son propre stack. L’objectif déclaré est de simplifier la migration depuis les environnements Nvidia. En robotique, l’intégration prévoit la continuité avec Isaac ROS, tout en déportant l’inférence sur le silicium DEEPX, sans réécriture lourde des pipelines existants.
Le choix du 2 nm chez Samsung indique un pari sur la densité et la maîtrise de la fuite statique pour tenir le 5 W visé. Sur un accélérateur edge, la cohérence mémoire, les formats de quantification et la bande passante SRAM/on-die seront déterminants pour atteindre 80 TOPS en utilisation réelle, bien plus que la seule finesse de gravure.
Contexte marché et viabilité
Avec un cap fixé à 2027, DEEPX se positionne face à des solutions concurrentes déjà échantillonnées ou en déploiement sur des segments voisins, des NPU mobiles aux accélérateurs compacts pour robots, caméras intelligentes et mini PC. La promesse de 80 TOPS à 5 W, si elle est tenue avec une chaîne d’outils robuste et des kernels optimisés, comblerait une niche où le GPU discret est surdimensionné et où les NPU intégrés des processeurs généralistes plafonnent encore.
La clé sera la portabilité des modèles actuels et à venir, notamment les LLM et multimodaux quantifiés, avec un outillage de calibration et de compilation réellement transparent depuis les frameworks dominants. Sans cela, même un bon ratio performance/watt risque de rester cantonné à des démos plutôt qu’à des déploiements industriels.
Source : ITHome