
Rokid préparerait une nouvelle génération de lunettes axées sur les « agents » IA, avec un système et une interface repensés autour de l’IA générative. D’après des sources citées par le média chinois Kechuangban Daily et reprises ce matin par ITHome, la société collabore avec une « grande maison de modèles » locale pour développer un modèle multimodal dédié fonctionnant en local sur l’appareil. Les ventes actuelles des lunettes Rokid tourneraient autour de 1200 unités par jour, moitié en ligne, moitié en boutiques.
Virage agentique et modèle embarqué
L’objectif affiché est d’exécuter des agents capables de gérer des tâches complexes par commandes vocales, avec un OS recentré sur ces flux. Rokid a déjà ouvert ce qu’il présente comme la première boutique d’« agents » du secteur : des micro-services vocaux couvrant des cas quotidiens (trajets de TGV, calcul de calories) et d’autres plus ludiques (détection de « ban »/plagiat de ton dans les devoirs, conversation dite à « haute intelligence émotionnelle »).

Au CES 2026, Rokid avait installé un large stand au cœur du salon pour ses Rokid Glasses, signe d’une accélération produit. La société dit avoir intégré plusieurs grands modèles chinois, dont DeepSeek, Tongyi Qianwen, Doubao et Zhipu, et tissé des partenariats avec Amap, Alipay et JD Technology. À l’international, les Rokid Glasses s’adossent notamment à Google Maps et Microsoft Translator.
Écosystème et cadence commerciale
Le focus sur un modèle multimodal embarqué doit réduire la dépendance au cloud, améliorer la latence des interactions et renforcer la confidentialité, des critères structurants pour des usages mains libres. Le rythme évoqué de 1200 unités/jour donne un ordre de grandeur rare sur le segment, encore fragmenté entre lecteurs AR et lunettes vocales à faible friction.
Reste à voir les arbitrages matériels nécessaires pour tenir en local des agents multimodaux pertinents: calcul embarqué, autonomie, dégagement thermique et confort. L’approche « magasin d’agents » permet à Rokid d’orchestrer vite de nouveaux cas d’usage sans refonte applicative lourde, un différenciateur crédible si l’exécution suit côté modèle et OS.
Source : ITHome