Qwen D’Alibaba Vient De Détrôner Llama Sur Hugging Face

Graphique montrant les téléchargements cumulés de Qwen, surpassant Mistral et Llama sur Hugging Face.

Hugging Face crédite désormais Qwen d’Alibaba de plus de 200 000 modèles dérivés et de plus d’un milliard de téléchargements cumulés, soit environ 1,1 million par jour. L’écosystème dépasse ainsi Llama en volume sur la place de marché open source, un jalon symbolique pour un acteur chinois sur un terrain historiquement dominé par les modèles américains.

Un indicateur d’influence: les modèles dérivés

Le nombre de dérivés sert de baromètre d’adoption dans la communauté: plus de 200 000 variantes Qwen sont référencées, avec plus de 200 nouveaux dépôts par jour selon Hugging Face. Les usages couvrent la génération de code, le contrôle robotique, la post‑production de bandes dessinées et la traduction multilingue. Cette dynamique reflète l’ouverture agressive d’Alibaba, qui a publié près de 400 modèles depuis 2023 et mis à disposition des fondations de tailles multiples.

Les contributions académiques s’agrègent au flux. L’équipe de Fei‑Fei Li à Stanford cite notamment un entraînement dérivé, « s1 », positionné sur l’optimisation des performances en raisonnement, signe que Qwen sert de base à des travaux de recherche amont au‑delà des simples fine‑tunings applicatifs.

Un portefeuille « pleine échelle » et multimodal

Qwen couvre des tailles de 0,5 à 480 milliards de paramètres et des capacités texte et vision. Qwen 3 revendique la prise en charge de 119 langues et dialectes. Cette granularité facilite le déploiement sur une large plage matérielle, des mini PC et stations de travail munies d’une ou deux cartes graphiques jusqu’aux serveurs multi‑GPU, tout en ouvrant la porte à des scénarios multimodaux et à des cas d’usage en langues peu dotées.

Le volume de téléchargements constitue l’autre métrique mise en avant pour mesurer l’atterrissage en production. Le cap du milliard place Qwen en tête des modèles open source les plus récupérés, un signal direct pour les intégrateurs qui s’appuient sur Hugging Face comme canal de distribution et de mise à jour.

Au‑delà de la course aux volumes, l’effet réseau est tangible: plus la base de dérivés s’étend, plus les améliorations et spécialisations remontent dans l’écosystème, qu’il s’agisse de jeux de données, de recettes d’entraînement ou d’optimisations d’inférence. Dans un marché où les coûts GPU restent la variable d’ajustement, la disponibilité de modèles à plusieurs échelles compatibles avec des cartes graphiques grand public est un levier d’adoption pragmatique.

Source : ITHome

Qwen dépasse Llama sur Hugging Face : 200 000 dérivés et 1 milliard de downloads

Un indicateur d’influence: les modèles dérivés

Un portefeuille « pleine échelle » et multimodal

Articles similaires

Wael.K

Lire le suivant

ChatGPT d’OpenAI ajoute des visualisations interactives pour apprendre les sciences

Silicon carbide 300 mm : Wolfspeed vise l’emballage AI/HPC d’ici la fin de la décennie

Ryzen AI Embedded P100 : AMD ajoute des modèles 8 à 12 cœurs avec Zen 5, RDNA 3.5 et XDNA 2

Edge AI MSI : écosystème complet et plateformes industrielles à Embedded World 2026

NVIDIA GeForce ON à la GDC 2026 : focus RTX, IA et path tracing, pas de nouveau GPU

ChatGPT d’OpenAI ajoute des visualisations interactives pour apprendre les sciences

Silicon carbide 300 mm : Wolfspeed vise l’emballage AI/HPC d’ici la fin de la décennie

Ryzen AI Embedded P100 : AMD ajoute des modèles 8 à 12 cœurs avec Zen 5, RDNA 3.5 et XDNA 2

Edge AI MSI : écosystème complet et plateformes industrielles à Embedded World 2026

NVIDIA GeForce ON à la GDC 2026 : focus RTX, IA et path tracing, pas de nouveau GPU