
Ant Group active aujourd’hui dans son application d’assistant IA « Lingguang » une fonction baptisée « Expérience du modèle du monde », présentée comme la première mise en poche d’un modèle du monde sur smartphone. Depuis un mobile, l’utilisateur peut « générer un monde 3D à partir d’une image » en important une photo, puis en choisissant « générer le monde de l’image », ou en tapant « explorer le monde en vue à la première personne ». Quelques secondes plus tard, un environnement explorable est disponible.
Un monde 3D jouable depuis une simple photo
Une fois dans ce « monde », la navigation se fait via un joystick virtuel, avec une marche libre en vue subjective, façon jeu vidéo. L’app s’appuie sur le modèle du monde LingBot-World-Fast d’Ant Group, indiqué comme ouvert en open source, ce qui laisse entrevoir des intégrations rapides côté communauté et une itération plus vive sur la qualité des reconstructions.

Le positionnement sur mobile est notable pour un usage historiquement cantonné au desktop et au cloud. Si la société ne donne pas de détails matériels ni de métriques de latence, la promesse d’une génération en « quelques secondes » sur smartphone suggère une inférence optimisée et potentiellement hybride, mêlant calcul local et back-end.
Au-delà de la démonstration, l’ouverture de LingBot-World-Fast peut accélérer l’émergence d’outils de prototypage rapide pour AR, level design léger et visualisation de scènes, avec un coût d’entrée minimal. La clé sera la robustesse des scènes générées à partir d’images imparfaites et la gestion des collisions et de la cohérence spatiale, points qui font généralement la différence entre gadget et usage productif.
Source : ITHome