Cerebras Et Qualcomm Redéfinissent Le Futur De L'IA

cerebras selects qualcomm ai inference cover

Cerebras et Qualcomm s’associent pour offrir une solution sans précédent dans le domaine de l’inférence IA. Leur collaboration promet de révolutionner l’efficacité et la rentabilité des déploiements d’IA en production grâce à une amélioration spectaculaire du rapport prix / performance, allant jusqu’à dix fois le nombre de jetons par dollar dépensé.

Ce partenariat marque un tournant décisif, non seulement en termes de performances mais également en réduisant radicalement les coûts opérationnels liés au déploiement de l’IA.

L’innovation au cœur de la collaboration Cerebras et Qualcomm

La collaboration entre Cerebras Systems et Qualcomm Technologies s’appuie sur l’intégration des accélérateurs IA CS-3 de Cerebras, leaders du marché pour l’entraînement, avec l’AI 100 Ultra de Qualcomm pour l’inférence.

Ce mariage technologique vise à optimiser les performances et la valeur des déploiements d’IA en production. Andrew Feldman, PDG et co-fondateur de Cerebras, souligne l’importance de cette collaboration qui ouvre la voie à une nouvelle ère d’inférence à haute performance et à faible coût. Leurs efforts conjoints promettent de réduire considérablement les coûts d’inférence sans compromettre la qualité des modèles, offrant ainsi les déploiements les plus efficaces à ce jour.

Techniques avancées et performances révolutionnaires

L’alliance stratégique entre Cerebras et Qualcomm repose sur l’exploitation de techniques de machine learning de pointe et d’une expertise IA de classe mondiale. Parmi les techniques avancées mises en œuvre, citons :

La Sparsité Non Structurée : Cette technique, accélérée par le matériel, permet des entraînements et des inférences utilisant une sparsité dynamique non structurée, améliorant considérablement l’efficacité des performances. Par exemple, un modèle Llama 13B entraîné sur le matériel Cerebras avec 85 % de sparsité s’entraîne jusqu’à quatre fois plus vite, et l’inférence avec l’AI 100 Ultra génère des jetons avec un débit jusqu’à trois fois supérieur.
Le Décodage Spéculatif : Cette technique avancée combine le haut débit d’un petit LLM avec la précision d’un grand LLM. La plateforme logicielle de Cerebras peut automatiquement entraîner et générer les deux modèles, ingérés de manière transparente via la Qualcomm® AI Stack, résultant en un modèle capable de produire des jetons avec un débit jusqu’à deux fois supérieur sans compromettre la précision.
Inférence MX6 efficace : L’AI 100 Ultra prend en charge MX6, un format micro-exposant standard de l’industrie qui réalise une inférence de haute précision en utilisant la moitié de l’empreinte mémoire et le double du débit de FP16.
Service NAS de Cerebras : En utilisant la recherche d’architecture de réseau pour des cas d’utilisation ciblés, la plateforme Cerebras peut livrer des modèles optimisés pour l’architecture IA de Qualcomm, aboutissant à une performance d’inférence jusqu’à deux fois supérieure.

Un avenir prometteur

La combinaison des solutions d’entraînement IA de Cerebras avec l’AI 100 Ultra de Qualcomm vise à offrir une performance de pointe en termes de coût total de possession pour l’inférence IA, ainsi qu’à fournir des modèles IA optimisés et prêts à être déployés. Cette collaboration promet non seulement une amélioration significative des performances et des coûts mais également une réduction du temps de déploiement et un retour sur investissement accéléré.

La recherche et le développement pharmaceutiques, comme le souligne Kim Branson, vice-président senior et chef mondial de l’IA/ML chez GlaxoSmithKline, bénéficieront grandement de ces avancées. Des techniques telles que la sparsité et le décodage spéculatif, qui accélèrent l’inférence tout en réduisant les coûts opérationnels, sont essentielles pour intégrer et expérimenter avec l’IA de manière plus accessible et abordable.

En conclusion, l’association de Cerebras et Qualcomm Technologies incarne une avancée majeure dans le domaine de l’intelligence artificielle, en rendant la technologie non seulement plus puissante mais aussi plus économique. À mesure que nous avançons, leur travail conjoint continuera sans doute à redéfinir les frontières de ce qui est possible dans l’IA.

Accédez à toute l’actualité de l’actualité IA sur Pause Hardware