Les IA ont le vent en poupe. Après la génération d’image de MidJourney ou la conversation tenue par ChatGPT, c’est Google qui s’illustre avec un nouvel outil capable de générer une musique à partir… d’un texte. Si l’idée n’est pas nouvelle, puisque que AudioLM (Google) ou JukeBox (OpenAI) en sont déjà capables, MusicLM, c’est son petit nom, dispose à l’instar de ChatGPT d’une énorme base de données (on parle de 280.000 h de musique) afin d’être le plus pertinent possible. Et ça marche !
Une page Github propose, à défaut d’utiliser l’outil, d’écouter quelques exemples. Les chercheurs à l’origine de MusicLM ont également publié leur étude sur le sujet sur Arxiv.org, dans un PDF d’une quinzaine de pages, qui explique le concept :
« Nous présentons MusicLM, un modèle d’IA capable de générer de la musique haute fidélité à partir de descriptions en texte telles que « une mélodie de violon apaisante soutenue par un riff de guitare déformé ». MusicLM considère la génération conditionnelle de musique comme une tâche de modélisation hiérarchique séquentielle et génère de la musique à 24 kHz qui reste cohérente sur plusieurs minutes. Nos expériences montrent que MusicLM surpasse les systèmes précédents à la fois en qualité audio et en conformité avec les descriptions en texte. De plus, nous démontrons que MusicLM peut être conditionné à la fois par un texte et une mélodie, car il peut transformer les mélodies sifflées et fredonnées selon le style décrit dans une légende de texte. » Pour soutenir les futurs recherches, nous publions MusicCaps, un jeu de données composé de 5,5k paires musique-texte, avec des descriptions en texte riches fournies par des experts humains. »
L’avenir de l’artistique semble de plus en plus s’écrire en 2 lettres. Même si l’IA ne remplacera probablement jamais les artistes de chair et de sang, elle représente une aide précieuse et une source d’inspiration sans fin.