LingBot-World : modèle de monde interactif open source, vidéo stable et contrôlable

Ant Group ouvre le code de LingBot-World, un cadre de « world model » interactif pensé pour générer des environnements vidéo contrôlables, physiquement cohérents et manipulables en temps réel. Au cœur, LingBot-World-Base s’appuie sur un Scalable Data Engine entraîné sur de grands environnements de jeu pour apprendre lois physiques et causalité, puis restituer des scènes réactives sans dérives structurelles sur de longues séquences.

Tableau comparatif des modèles de génération mondiale avec critères de performance.

Longues séquences stables, logique de scène conservée

Le modèle vise la résistance au « long-term drift » qui plombe la génération vidéo classique: déformations, disparition de sujets, collapses de géométrie. Par un entraînement multi-étapes et une exécution parallélisée, Ant Lingbo annonce près de 10 minutes de génération continue sans dégradation visible, avec des tests de retour caméra après 60 secondes hors-champ où les objets clés conservent forme et apparence.

Van coloré traversant un pont moderne sous un ciel partiellement nuageux.

La génération est conditionnée par l’action: clavier et souris pilotent personnage et caméra à environ 16 FPS, avec une latence bout en bout maintenue sous la seconde. Les commandes textuelles déclenchent des événements d’environnement (météo, style visuel) tout en maintenant des relations géométriques stables, ce qui permet d’enchaîner des transitions sans casser la cohérence de la scène.

Pipeline de données hybride et zero-shot interactif

Pour alimenter l’entraînement en données d’interaction, l’équipe combine un nettoyage massif de vidéos web et une captation in‑engine via jeux et pipeline Unreal Engine, en extrayant des rendus sans UI et en enregistrant commandes et poses caméra au pas de temps. Ce mix améliore la généralisation zero-shot: à partir d’une simple photo de rue réelle ou d’une capture de jeu, le modèle génère un flux vidéo interactif sans fine-tuning spécifique au décor.

Ant Lingbo met en ligne poids et code d’inférence. Le dépôt et la documentation sont accessibles à l’adresse suivante: https://technology.robbyant.com/lingbot-world

Petite église à toit rouge sur une colline verte en campagne.

Si les promesses d’endurance temporelle et de contrôle se confirment, LingBot-World pourrait accélérer l’émergence d’agents temps réel entraînés dans des mondes génératifs plutôt que dans des bacs à sable fixes. Pour l’industrie, l’intérêt est double: abaisser le coût des données d’interaction de qualité et rapprocher la simulation des contraintes physiques utiles au gameplay et à la robotique logicielle, avec un délai de réponse compatible usage utilisateur.

Source : ITHome

Wael.K

Ravi de vous accueillir sur ma page dédiée aux articles ! Je suis Wael El Kadri, et je suis un ingénieur civil de profession. Mais ma véritable passion est le matériel informatique. J'en suis passionné depuis l'âge de 12 ans, et j'aime apprendre et découvrir de nouvelles choses. En 2016, j'ai créé ma page personnelle sur les réseaux sociaux, baptisée Pause Hardware. C'est là que je partage mes créations en modding, mais aussi divers sujets liés au matériel informatique en général. J'ai également crée le site web, pausehardware.com, en 2019 où je publie des articles plus approfondis sur le matériel à travers des tests et revues et articles de news. J'ai eu l'opportunité de participer en tant qu'exposant à plusieurs événements liés aux jeux vidéo, aux côtés de grandes marques, notamment lors de la Paris Game Week en 2018 et 2019. Je reste constamment en quête de nouvelles manières de partager mes connaissances et ma passion pour le matériel informatique avec d'autres passionnés. Voici quelques publications médiatiques qui ont mis en lumière mon travail : Deux articles dans le magazine Extreme PC, parus dans ses  numéros 1 et 21 : Extreme PC Magazine Issue 21 (adobe.com) Également, un article sur Forbes intitulé "Dix Modèles de PC Incroyables en 2021" sur forbes.com : Ten Incredible PC Mods Of 2021 (forbes.com)
guest
0 Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
Bouton retour en haut de la page
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x