
À l’I/O 2026, Google a présenté une mise à niveau importante de son studio de création IA Google Flow, avec l’intégration de Gemini Omni Flash et une série d’outils centrés sur la production vidéo, l’assistance créative et la musique. Né l’an dernier comme boîte à outils pour cinéastes, Flow a évolué en plateforme créative globale, désormais disponible dans plus de 140 pays.
Gemini Omni Flash au cœur du nouveau Google Flow
Le nouveau socle repose sur Gemini Omni Flash, qui renforce la précision du montage vidéo et la cohérence des personnages d’un plan à l’autre. L’objectif est clair : stabiliser l’apparence d’un même protagoniste sur des séquences multiples pour limiter les dérives visuelles lors des itérations génératives. Cette capacité est déjà disponible pour les abonnés Google AI à l’échelle mondiale.
Au-delà du modèle, Google ajoute Flow Agent, un compagnon de pilotage de projet capable de planifier des tâches complexes, d’alimenter le brainstorming et de proposer des variantes de scripts, de dialogues ou de retournements narratifs. L’agent gère aussi des éditions par lots, utile pour harmoniser des changements sur des rushes ou des pistes multiples. La fonction est ouverte à tous les utilisateurs de Flow.
Outils et workflows personnalisables
Flow Tools permet de définir des outils et des chaînes de production sur commande vocale ou textuelle, du simple redimensionnement vidéo à la création de shaders personnalisés. Ces modules sont partageables entre utilisateurs, de quoi accélérer la standardisation des pipelines et réduire les frictions entre départements créa et post-prod.
Musique : édition fine et remaster sans casser la structure
Sur le versant audio, Flow Music gagne une édition segmentée plus granulaire. On peut retoucher un morceau par sections, réécrire ou traduire des paroles, infléchir le style des drops, tout en proposant une recomposition complète qui conserve mélodie et structure d’origine. Le positionnement vise à concilier créativité rapide et continuité musicale.
La montée en finesse de Flow Music s’inscrit dans un mouvement plus large chez Google, où l’IA s’invite aussi dans les usages du quotidien. On l’a vu avec la dictée Gemini dans Gboard, pensée pour fluidifier les échanges sans perdre le fil entre plusieurs langues, un objectif finalement proche de celui poursuivi ici sur l’édition musicale.
En consolidant la cohérence multi-plans, l’orchestration par agent et la personnalisation des workflows, Google ancre Flow comme une couche d’infrastructure créative plus que comme un simple outil de démo IA. La capacité à partager des outils maison et à industrialiser les itérations créatives est le vrai levier ici, avec un impact direct sur les coûts de post-production et le time-to-content des studios et créateurs avancés.
Source : ITHome