Stability Audio 3.0 : quatre modèles IA pour générer jusqu’à 6 min 20 de musique

Stability AI lance Stability Audio 3.0, une nouvelle famille de modèles de génération sonore dont la version la plus avancée promet de produire des morceaux « professionnels » jusqu’à 6 minutes 20, soit plus du double de la durée atteinte par Stable Audio 2.0 l’an dernier.

Quatre modèles, des usages distincts

La gamme comprend quatre variantes : deux petits modèles à 459 millions de paramètres (XFS et une déclinaison « small ») conçus pour l’exécution sur appareil, capables de générer localement jusqu’à deux minutes d’effets sonores ou de musique, un modèle « medium » à 1,4 milliard de paramètres et un « large » à 2,7 milliards de paramètres. Les versions medium et large se distinguent par un pilotage plus fin de la structure musicale, avec maintien précis du thème et de l’harmonie sur des durées étendues.

Tableau des caractéristiques des modèles IA Stable Audio 3.0

Stability AI ouvre les poids des modèles SFX small, small et medium. Le modèle large reste réservé à l’API et à l’hébergement payant, avec une exigence de licence commerciale pour les entreprises dont le chiffre d’affaires annuel dépasse 1 million de dollars (environ 918 000 €).

Cadre de licence et jeu de données

Pour limiter le risque juridique, la société rappelle avoir noué l’an dernier des accords de licence avec Warner Music Group et Universal Music Group. Stability affirme que Stability Audio 3.0 a été entraîné exclusivement sur des données sous licence.

Virage pro et gouvernance produit

Un nouveau portefeuille destiné aux musiciens professionnels est en préparation, sans détails fonctionnels pour l’instant. Ethan Kaplan, ex-Global Head of Audio chez Universal et ex-Chief Digital Officer de Fender, rejoint l’entreprise pour piloter cette offre.

En proposant des petits modèles exécutables en local et un grand modèle premium uniquement via API, Stability AI segmente clairement les cas d’usage: prototypage rapide et embarqué d’un côté, production longue et sous contrôle strict de l’autre. Cette architecture miroir du marché de l’image générative devrait accélérer l’adoption en studio tout en cadrant la conformité, à condition que la latence, la qualité timbrale et la cohérence structurelle promises se vérifient dans les workflows réels.

Source : ITHome

Wael.K

Ravi de vous accueillir sur ma page dédiée aux articles ! Je suis Wael El Kadri, et je suis un ingénieur civil de profession. Mais ma véritable passion est le matériel informatique. J'en suis passionné depuis l'âge de 12 ans, et j'aime apprendre et découvrir de nouvelles choses. En 2016, j'ai créé ma page personnelle sur les réseaux sociaux, baptisée Pause Hardware. C'est là que je partage mes créations en modding, mais aussi divers sujets liés au matériel informatique en général. J'ai également crée le site web, pausehardware.com, en 2019 où je publie des articles plus approfondis sur le matériel à travers des tests et revues et articles de news. J'ai eu l'opportunité de participer en tant qu'exposant à plusieurs événements liés aux jeux vidéo, aux côtés de grandes marques, notamment lors de la Paris Game Week en 2018 et 2019. Je reste constamment en quête de nouvelles manières de partager mes connaissances et ma passion pour le matériel informatique avec d'autres passionnés. Voici quelques publications médiatiques qui ont mis en lumière mon travail : Deux articles dans le magazine Extreme PC, parus dans ses  numéros 1 et 21 : Extreme PC Magazine Issue 21 (adobe.com) Également, un article sur Forbes intitulé "Dix Modèles de PC Incroyables en 2021" sur forbes.com : Ten Incredible PC Mods Of 2021 (forbes.com)
guest
0 Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
Vous aimez PauseHardware ?
Ajoutez-nous à vos sources favorites sur Google pour voir apparaître nos contenus directement dans votre fil d’actualité.
⭐ Ajouter Non merci
0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x