
L’intelligence artificielle générative peut également être utilisée pour qu’à partir d’un simple texte, il soit possible de créer de la musique et des effets sonores ; C'est du moins la grande promesse de Stable Audio , un modèle d'IA capable de synthétiser des sons à partir de descriptions écrites développées par Stability AI .
L'outil peut générer des clips d'une durée maximale de 95 secondes dans une variété de genres musicaux, notamment la pop , le rock et le hip-hop. Et pour former le modèle, la société s'est associée à AudioSparx , un fournisseur de catalogue de musique, dans le but d'obtenir une licence pour un ensemble de données composé de plus de 800 000 fichiers audio , ainsi que des métadonnées du texte correspondant.
Après avoir saisi 19 500 heures d'audio , l'IA sait imiter certains sons qu'elle a entendus sur commande car les sons ont été associés à des descriptions textuelles de ceux-ci au sein de son réseau neuronal . En fait, Stable Audio utilise une technique appelée diffusion latente , qui est un type d'apprentissage automatique qui crée de nouvelles données en réduisant le fichier audio de manière à conserver ses caractéristiques importantes et à éliminer les bruits inutiles. À mesure que la plateforme est exposée à davantage de bruit, elle apprend à générer un son plus complexe et plus réaliste.

Une autre partie utilise du texte, tel que des descriptions de métadonnées de musique et de sons, pour aider à déterminer le type d'audio généré. Et pour accélérer les choses, il fonctionne sur une représentation audio simplifiée et compressée pour réduire le temps d'inférence, c'est-à-dire le temps nécessaire à un modèle d'apprentissage automatique pour générer une sortie une fois qu'elle a reçu une entrée.
Bien que l'audio généré puisse répondre aux spécifications du format CD en termes de profondeur de bits et de fréquence d'échantillonnage, la qualité perceptuelle réelle de la musique que vous produisez peut varier considérablement car l'audio est généré à partir d'une représentation compressée de l'ensemble de données.
Comment créer de la musique avec cette IA
- La première chose à faire est d'accéder au site Web principal de Stable Audio et de créer un compte ou de vous connecter avec un compte existant.
- Une fois le dépôt effectué, il ne vous reste plus qu'à inscrire le type de musique que vous souhaitez obtenir dans la case de la colonne de gauche.
-Il y a aussi la possibilité de choisir la durée de l'audio.
- Une fois ces caractéristiques définies, vous devez cliquer sur le bouton flèche droite pour créer.
- Au bout de quelques secondes un résultat sera généré dans la colonne de droite, avec un bouton play pour l'écouter. Il est également possible de le télécharger.
Il est important de préciser que plus le texte avec les instructions est précis et détaillé, meilleurs seront les résultats.
Types de prestations

Stable Audio a été conçu pour créer de la musique pour tout usage, à la fois commercial et non commercial, qu'il s'agisse d'une boucle pour une chanson ou d'idées de riffs de guitare qui peuvent ensuite être développées en une chanson complète.
L'outil est disponible gratuitement et permet aux utilisateurs de créer jusqu'à 45 secondes d'audio pour 20 pistes par mois. Il propose également un forfait Pro mensuel de 12 $, qui comprend 500 pistes d'une durée maximale de 90 secondes ; et un abonnement Business, grâce auquel les entreprises peuvent personnaliser son utilisation et son prix.
Cependant, ceux qui utilisent la version gratuite ne peuvent pas utiliser commercialement l’audio qu’ils créent avec Stable Audio.