
Question simple, démo coup de poing : Strix Halo fait tourner huit LLM locaux en parallèle pour trancher l’énigme « le hot-dog est-il un sandwich ? ». AMD s’en sert pour exhiber ce que Strix Halo peut encaisser, sans cloud, sur un PC.
Strix Halo, huit cerveaux IA locaux et un débat sans fin
La démonstration s’exécute sur un système Ryzen AI MAX 395+, avec huit modèles compacts chargés simultanément, entre 3B et 8B de paramètres chacun, via le serveur Lemonade d’AMD. Une web app partage un même historique de discussion, lance cinq manches, puis impose un vote final. Sans surprise, le verdict s’aligne sur la tradition du sujet : pas de réponse nette, décision partagée, et au moins un modèle sûr de lui malgré tout.

Le clin d’œil communautaire n’a pas tardé : d’après les commentaires, il faudrait « un neuvième modèle, comme la Cour suprême », quand un autre ironise que ce neuvième finirait de toute façon par halluciner. AMD publie les étapes pour reproduire la joute verbale, tout en rappelant que le support NPU sous Linux est encore en cours de maturation. Oui, huit modèles peuvent tourner en parallèle sur PC, mais la question demeure côté joueurs : Strix Halo n’était-il pas pensé comme APU gaming ? Il semblerait qu’AMD pousse ici un autre angle.
Strix Halo en pratique : LLM locaux, cinq rounds, vote final
Concrètement, la démo orchestre huit petits modèles locaux via Lemonade, partage une unique conversation, déroule cinq tours, puis force une prise de position collégiale. AMD résume l’esprit de l’exercice : « la meilleure façon de montrer les capacités de Strix Halo ». Au passage, rappel utile pour les bidouilleurs : le support Linux côté NPU reste à affiner.
Source : VideoCardz