
Plusieurs créateurs YouTube, dont h3h3, MrShortGame Golf et Golfholics, ont déposé une plainte contre Snap. Ils accusent l’entreprise d’avoir utilisé leurs vidéos pour entraîner un modèle d’IA intégré à Imagine Lens, en s’appuyant sur le jeu de données HD-VILA-100M, réservé à un usage académique et explicitement non commercial.
Les plaignants soutiennent que Snap a outrepassé la licence du dataset, puis déployé le modèle dérivé dans un produit grand public. La procédure vise des dommages légaux et une injonction permanente interdisant tout usage ultérieur litigieux. Snap n’a pas détaillé publiquement son pipeline d’entraînement ni l’étendue de l’exploitation des contenus concernés.
Un contentieux qui s’ajoute à un front judiciaire déjà encombré
Selon la Copyright Alliance, plus de 70 actions similaires visant des sociétés d’IA sont en cours aux États-Unis. La plupart s’enlisent dans des débats sur les licences de datasets, l’exception de fair use et la qualification d’usages commerciaux, sans décision de fond à ce stade.
Le cœur du dossier HD-VILA-100M est classique: un corpus proposé pour la recherche publique, assorti d’une clause interdisant la commercialisation. Si la preuve du chaînage entre ce corpus et un modèle en production est apportée, le risque pour Snap dépasse l’amende: l’injonction pourrait forcer des retrainings, une purge de données et un gel fonctionnel d’Imagine Lens.
Enjeu technique et industriel
Pour les plateformes, la documentation du sourcing de données d’entraînement devient une question de résilience produit. Un modèle lié à un dataset non commercialisable peut contaminer une chaîne complète: checkpoints, pondérations dérivées, voire les fine-tunes. À l’échelle, chaque retrait implique réentraînement, recalibrage qualité et coûts de calcul, avec un impact direct sur le time-to-market des fonctionnalités génératives.
Source : ITHome



