Ryzen AI Software 1.7 : MoE GPT‑OSS, Gemma‑3 4B VLM et BF16 deux fois plus rapide

Le local-first prend du galon : prise en charge élargie des architectures clés et latences en nette baisse, de quoi renforcer les applications d’IA embarquée. Côté AMD, les développeurs gagnent en couverture de modèles et en prévisibilité sur NPU et iGPU.

Ryzen AI 1.7 : architectures élargies et pipeline unifié

La version 1.7 ajoute le modèle Mixture-of-Experts GPT‑OSS et le VLM Gemma‑3 4B, exécutables sur NPU. Les MoE routent les tokens vers des experts, offrant un meilleur débit pour des capacités supérieures sans le coût d’un dense complet.

Côté multimodal, Gemma‑3 4B ouvre la voie au raisonnement image‑texte, au captioning, à la recherche visuelle légère ou aux agents multimodaux. Les développeurs peuvent comparer dense, MoE et VLM sous les mêmes contraintes matérielles.

Ryzen AI Software 1.7 : MoE GPT‑OSS, Gemma‑3 4B VLM et BF16 deux fois plus rapide

Stable Diffusion est désormais intégré à l’installeur principal Ryzen AI. Fini les environnements Python séparés: outillage unifié pour LLM, VLM et SD, mise en place plus prévisible et itérations plus rapides pour texte‑vers‑image, image‑vers‑image ou workflows hybrides.

Contexte 16K et BF16 ~2x plus rapide sur NPU + iGPU

La plupart des LLMs supportent désormais jusqu’à 16K tokens en mode hybride iGPU + NPU. Assez pour les documents longs, les conversations étendues et des stacks RAG locaux moins tronqués et mieux ancrés.

Le pipeline BF16 gagne en réactivité avec une latence sensiblement réduite, pour un débit approximativement doublé face à RAI 1.6. Résultat: temps‑au‑premier‑token plus court et boucles agents plus fluides, y compris sur modèles pré‑entraînés et fine‑tunés.

Implications pour les devs Ryzen AI

Moins de friction d’installation, plus de choix d’architectures et une fenêtre de contexte élargie changent le rythme des prototypages locaux. En combinant VLM, MoE et SD dans un environnement unique avec des gains BF16 tangibles, la pile on‑device devient plus crédible pour des features LLM/VLM prêtes à l’embarqué.

Source : TechPowerUp

Wael.K

Ravi de vous accueillir sur ma page dédiée aux articles ! Je suis Wael El Kadri, et je suis un ingénieur civil de profession. Mais ma véritable passion est le matériel informatique. J'en suis passionné depuis l'âge de 12 ans, et j'aime apprendre et découvrir de nouvelles choses. En 2016, j'ai créé ma page personnelle sur les réseaux sociaux, baptisée Pause Hardware. C'est là que je partage mes créations en modding, mais aussi divers sujets liés au matériel informatique en général. J'ai également crée le site web, pausehardware.com, en 2019 où je publie des articles plus approfondis sur le matériel à travers des tests et revues et articles de news. J'ai eu l'opportunité de participer en tant qu'exposant à plusieurs événements liés aux jeux vidéo, aux côtés de grandes marques, notamment lors de la Paris Game Week en 2018 et 2019. Je reste constamment en quête de nouvelles manières de partager mes connaissances et ma passion pour le matériel informatique avec d'autres passionnés. Voici quelques publications médiatiques qui ont mis en lumière mon travail : Deux articles dans le magazine Extreme PC, parus dans ses  numéros 1 et 21 : Extreme PC Magazine Issue 21 (adobe.com) Également, un article sur Forbes intitulé "Dix Modèles de PC Incroyables en 2021" sur forbes.com : Ten Incredible PC Mods Of 2021 (forbes.com)

Articles similaires

guest
0 Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
Bouton retour en haut de la page
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x