Résumé de l’article précédent

J’ai probablement abusé dans mon article précédent… C’est vrai quoi : ce n’est pas parce que j’ai trop peu de famille et d’amis et que ça m’empêche de lancer mon projet de financement participatif que ça doit rejaillir sur vous. Certes, c’est un problème non négligeable mais quand bien même, vous n’en êtes pas spécialement responsables. Après, je maintiens ce que j’ai dit : j’ai une aversion réelle pour les réseaux sociaux et j’ai beaucoup, mais alors beaucoup de mal à trouver du positif dans les réseaux sociaux.

Peut-être que simplement j’ai voulu m’en tenir éloigné jusqu’à maintenant pour avoir une certaine forme de paix, pour ne pas ressentir la pression du public pour que je sorte quelque chose prochainement alors que je viens à peine de boucler un nouveau projet qui m’a demandé pas mal de travail ? Peut-être aussi que j’estime qu’il y a un temps pour créer et un temps pour mettre en avant ce que l’on a créé et qu’en fait je n’ai jamais dépassé le premier stade ? Ce serait plausible et crédible.

Maintenant, la problématique c’est surtout que je vais devoir trouver un moyen de former une communauté et c’est pas gagné… Comme je le disais précédemment, TuneCore semble être une bonne option mais… Même s’ils acceptent les productions ayant recours à l’IA les conditions restent difficile à assurer pour garantir la possibilité d’une édition, surtout avec le procès de la RIAA qui porte plainte contre SUNO et UDIO au même moment où je lance mon projet et ça, quelque part c’est insupportable !

Bon, après quelque part je peux toujours revendiquer le fait de partir le plus souvent possible d’une démo exploitable pour reconstruire une chanson mais le résultat dépend fortement de ce qui a été enregistré initialement et sur les versions des « PrEvIoUsLy UnReLeAsEd » 1 à 3 l’enregistrement est fait avec les moyens du bord tandis qu’avec la 4ème itération on a enfin du son exploitable qui permet de ramener beaucoup plus de compositions faites sur la base d’une démo…

Mais justement, on va en parler de la mécanique dans cette article !

13. Construire avec SUNO – Partie 1

Bon, dans cet article on va parler un peu « technique ». Rassurez-vous, je ne vais pas vous embrouiller la tête avec des termes techniques imbitables en pagaille mais simplement vous expliquer comment je travaille avec SUNO et les problèmes que je peux rencontrer… Vous allez voir, ça va vous plaire ! En tout cas, vous allez vite comprendre pourquoi ça devient vite compliqué dans certains cas de donner un apport autre que les paroles et la structure à une chanson. En effet, il ne faut pas que la chanson soit 100% générée par l’IA pour passer chez TuneCore. Pour moi, le 100% généré correspond à une génération automatique via un prompt dans SUNO. Là en effet il n’y a aucun apport du musicien puisqu’à part le prompt qui représente max 5% d’input, la structure et les paroles ne sont même pas écrites par l’auteur et donc là il n’y a pas de pilote dans l’avion… L’idéal, c’est d’avoir ses propres paroles et de savoir structurer ses chansons : Pour moi ça représente 25% du travail initial. J’accorde 25% de plus pour l’assemblage, le découpage et les écoutes et sélection des différentes partie d’une même chanson (la valeur ajoutée passe aussi par la « patte créative » de l’artiste, sinon c’est pas drôle) et le top du top c’est quand on peut ramener des bouts de la démo originale dedans… Voyons ça en détail :

Le fameux « prompt » de SUNO pour les branloutes de base

Déjà il faut savoir que par défaut, il est hors de question que je fasse un prompt pour créer une chanson. Non, moi je vais vraiment me faire chier à taper des paroles et la structure de la chanson avec. D’ailleurs il y a un site non-exhaustif mais tout de même assez complet qui peut vous aider à écrire plus que des prompts : c’est le Graal du paramétrage de SUNO et c’est en fait un WIKI assez court et succinct mais pour une base de départ c’est juste génial et c’est disponible ici ! Après, vous avez totalement le droit de demander à l’IA de faire un peu autre chose voire n’importe quoi et même tester des trucs… Des fois ça va marcher, des fois le truc en question va tellement merdouiller que vous aurez envie de jeter la piste à la poubelle dans la foulée… Quand le chanteur commence à chanter « with a 80 bpm tempo » et « choir of female voices » alors que c’était juste des indications sur ce que tu souhaitais générer à ce moment-là bah forcément ça ne le fait pas du tout… Des fois, SUNO a quand même un peu de mal à faire ce qu’on lui demande mais on en parlera un peu plus tard ;

Et le mode « Custom » pour celles et ceux qui veulent en chier des ronds de chapeaux !

En ce qui me concerne, je ne fais jamais de « prompt » et je passe toujours par le mode « Custom » sans pour autant cliquer sur « Surprise Me » parce que c’est de la génération automatique de paroles. Concrètement, ce que je veux en tant que musicien, c’est apporter une « patte », un feeling que tu retrouves à travers le son et les paroles, une réelle identité. Tous les musiciens ou presque te diront que ce qui est généré par l’IA n’a pas d’âme… Et c’est vrai pour le mode « prompt » mais beaucoup moins dans le mode « custom » où les paroles et le style de musique vont largement influer sur le rendu final. En effet, l’IA va devoir analyser les paroles pour les prononcer et trouver la voix la plus appropriée… Il est donc clair que l’IA se laisse aussi influencer par les entrées qu’on lui donne et plus elles sont de qualité, plus ce qui en ressort ressemble de moins en moins à une imbuvable soupe re re re re re re re chauffée ! Et si en plus on rajoute sa propre piste sonore d’origine, alors là… Plus aucune excuse pour dire que l’on ne peut pas faire quelque chose de différent et de potable avec l’IA.

Dès que c’est possible, je passe par « Upload Audio » pour démarrer une chanson avec un extrait réel.

Mais avant d’aller taquiner l’IA et de lui dire vas-y, génère-moi une piste qui déchire tout ce qui existe et que l’IA me fasse un truc inexploitable qui se mange et se vomit lui-même en continu, j’ai un travail préparatoire à faire… Bah oui, parce que c’est bien beau de lui dire « vas-y, mange le morceau de 6 à 60 secondes que je vais te donner comme base de la chanson » mais si on n’a pas préparé le morceau et qu’on lui balance une piste de 8 minutes, il va juste gueuler et dire « eh oh ! y’a pas marqué la Poste là » et il va te le recracher à la gueule… Pas plus de 60 secondes voire 59 pour être sûr que ça va passer… Et là on fait comment ? Bah déjà, on va s’équiper avec un logiciel qui coûte rien mais qui est tellement efficace qu’on aurait presque envie de payer tant il va nous rendre des services incommensurables. Je vous demande de faire une ovation pour « AUDACITY », le logiciel qui va nous simplifier la vie ! Mais juste avant de l’utiliser, je vais vous montrer un truc qu’on ne montre jamais d’habitude :

Mais… on dirait un plan, un vrai !!!

Parce que oui, je ne travaille pas en aveugle. Avant de commencer tout ça j’ai pris le temps de faire un fichier Microsoft Excel dans lequel j’ai soigneusement consigné mes différents albums selon une structure quasiment identique d’un album à l’autre… Et vous savez quoi ? Ça marchait bien jusqu’à ce que j’arrive à PrEvIoUsLy UnReLeAsEd VII – R.E.P.L.I.C.A.T.O.R.S. et là c’est le drame. Je vous explique : jusqu’à ce qu’on arrive à cet album, je composais des chansons qui se situaient au niveau durée entre 4 et 6 minutes grand max avec parfois quelques exceptions. L’idée c’était de ne jamais dépasser 1 heure par album et de mettre 12 chansons par album. Or, les chansons du R.E.P.L.I.C.A.T.O.R.S. ont ceci de particulier qu’elles sont moins nombreuses et vachement plus longues.  J’ai une explication rationnelle à fournir mais je la garde pour les chroniques de la réalisation des différents albums dont je parlerais bien plus tard… D’abord on va aborder la réalisation et donc ma prochaine piste c’est « Metalorganic Silence ». Ça va être quelque chose !

Quand ta compo dure 7 fois plus longtemps…

Alors voilà, j’ai ouvert ma démo d’origine et d’office la longueur est de 7 minutes et 41 secondes. Le vrai challenge commence maintenant car il va falloir réduire de 7 fois la taille de cette démo pour en capturer l’essence et qu’elle soit suffisamment explicite pour que l’IA de SUNO soit capable de reconstruire une version qui tienne la route et qui soit proche et respectueuse du matériau d’origine… Bah ouais, parce que sinon autant se passer du matériel d’origine et passer directement à une génération propre qui part de zéro… Sauf que ça va s’éloigner de l’objectif qui est de faire une réécriture et une réinterprétation des démos pas terminées de l’époque, donc ne pas utiliser le son d’origine bah… C’est pas la même chose quoi ! Encore faut-il que ce soit possible et on verra plus tard que parfois… Ben c’est juste pas possible de faire autrement ! Par contre, là, on devrait pouvoir y arriver même s’il y a une contrainte à prendre en compte qui est loin d’être anodine : pour que le morceau soit généré à partir du morceau qu’on va lui donner, il faut qu’il commence par ce morceau… ça veut donc dire qu’il faudra d’ores et déjà conserver quelques secondes pour une intro et éviter l’effet « patchwork » des riffs superposés… Autant dire qu’on va s’amuser. Il est minuit passé de 3 minutes et je vais commencer à préparer mon fichier… On verra combien de temps je mets pour en venir à bout !

…et que tu la réduit à sa plus simple expression !

C’est fait. il est minuit 22, j’ai travaillé relativement vite mais je n’ai pas pu faire grand-chose. En effet, sur cette compo j’ai un genre de solo qui accompagne la chanson durant toute sa durée et qui joue en premier plan des mélodies qui se ressemblent mais qui sont suffisamment différentes selon la partie de la chanson. « Metalorganic Silence », ça commence hyper-lent et si la boite à rythme reste toujours fixe c’est la rythmique qui accélère la chanson. Typiquement c’est un effet d’illusion auditive : on a l’impression que la chanson va plus vite et est plus rythmée mais c’est juste qu’en fait le nombre de notes jouées passe de 1 à 2, puis 4, 8, 16 et finit à 32. L’IA pourrait même aller au-delà mais pour un humain le 32 c’est déjà chaud à garder en constant sur la durée… Je ne parle même pas de la difficulté à passer de l’un à l’autre parce que ça veut dire quand même qu’on maîtrise deux rythmiques : celle que l’on joue et celle de la boite à rythme qui nous sert de repère. Croyez-moi, « Metalorganic Silence » c’est une véritable expérience auditive… Le souci c’est que j’aurais voulu garder une période de 1, une de 2, une de 4 etc. mais si je fais ça ça va faire patchwork et coller une 16 ou une 32 derrière une 4 ça fait dégueulasse, surtout avec le solo qui ne joue pas la même chose… Donc j’ai gardé le concept du 1, 2 et 4… espérons que l’IA arrive à saisir le concept et me recrache quelque chose qui ne fait pas du 1 2 4 1 4 2 4 2 1 sinon ça va être lent, mais lent… Et ça va péter le concept de la chanson ! Après, l’IA n’est pas dans ma tête ; elle fera avec ce que je lui donne mais franchement 60 secondes c’est vraiment pas assez ! Si au moins on pouvait lui dire « Ok, ça c’est 60 secondes pour l’intro, ça c’est 45 secondes du couplet, ça c’est 27 secondes du refrain et ça c’est les 37 secondes de solo » ce serait génial ! On n’aurait plus à se creuser la tête pour créer un sample qui nécessite une intro, qui est limité et qui ne permet pas de faire ce que je viens d’évoquer. Allez, allons nous marrer avec le sample qu’on vient de créer !

14. Construire avec SUNO – Partie 2

Avant de se lancer à corps perdu dans la génération de morceaux, il reste encore une étape indispensable dans le processus. Il va falloir écrire des paroles ! Bon, pour la plupart des anciennes compositions le travail était déjà fait et nécessitait quelques retouches… En effet, mon anglais d’origine est absolument dégueulasse et j’ai commis de nombreuses atrocités. Quand on ne s’en rend pas compte, ce n’est pas grave en soi mais quand de vrais anglophones vous disent « euh, là en fait t’as employé le mauvais mot et du coup ça ne veut plus rien dire » eh bien faut quand même avouer que ça fait chier et qu’on passe bien pour un con. Alors même si ça m’arrive plus que de raison (de passer pour un con), il faut quand même souligner que malgré le côté « yaourt » de certains de mes textes je m’efforce quand même d’aller en vérifier le sens dans Google Traduction. D’aucuns diront « Google c’est de la merde, ça te traduit parfois de la bouse ». J’en ai conscience et c’est pour ça que je l’écris en anglais pour qu’il le traduise en français, puis je fais un échange de langue, je corrige au besoin en français puis je repasse en anglais. Normalement, en 3 fois j’arrive à avoir un texte pratiquement juste et qui tient la route…

Un texte écrit avec Google Crade 😉

Oui, c’est paradoxal parce que j’écris mon texte en anglais d’abord mais d’un autre côté, on imagine le chant en anglais donc la rythmique du chant va se caler sur la rythmique du morceau (et on va faire ça en général en écoutant le morceau pendant qu’on rédige les textes). Alors évidemment, on part du morceau d’origine et pas de l’exemple qu’on a préparé et qui de toute façon va servir d’introduction instrumentale avant qu’on attaque le chant… Sauf si on traite une instrumentale et dans ce cas-là il n’y a pas de chant ou si on aime un peu les groupes genre ISIS qui peuvent claquer une chanson de 6 minutes et ne chanter que pendant 1 minute dans tout le morceau et encore vers la fin. Et le R.E.P.L.I.C.A.T.O.R.S. c’est exactement dans ce style-là qu’il a été pensé… Conclusion ? On a écrit des paroles mais elles ne serviront pas tout de suite ! On va d’abord utiliser notre sample, puis construire une première génération instrumentale qui nous donnera la direction à suivre…

Et voilà, un nouveau sample de 57 secondes a été chargé !

C’est le point de départ qu’il va falloir étendre. Ne pas oublier de cliquer sur [Extend] !

On part en custom, instrumental, avec un style qui tue et un titre classe… et 40 crédits, la loose !

Et à partir de maintenant, on va vraiment rentrer dans le cœur de la composition. On a choisi notre style musical, notre titre et on part de notre démo de 57 secondes qui a perdu 1 seconde au passage mais c’est pas grave. L’idée c’est que maintenant on puisse voir déjà les générations qui nous sont proposées. Et il va falloir attendre un peu si on veut l’écouter en complet, le temps que l’IA la génère en temps réel. Alors quand on a une connexion fibre, ça se passe relativement bien mais avec une connexion moins bonne, il vaut mieux attendre qu’il affiche les temps de la génération. Autre détail qui a son importance : quand je charge mon « sample », SUNO va automatiquement aller faire une vérification de copyright… En effet, ils prennent très au sérieux le copyright des artistes (même si c’est clairement ça que la RIAA leur reproche mais enfin bon…) et il est clairement indiqué qu’on n’a pas le droit de charger des morceaux provenant d’une chanson connue. Alors ça tombe bien, parce que mes démos bah… C’est pas connu donc quelque part je ne m’inquiète pas mais je sais aussi que je n’irais pas faire le malin à charger des bouts de chanson sous copyright… Si je fais ça et que SUNO me choppe, ils peuvent me virer du site et franchement c’est la dernière chose dont j’ai envie… Donc, voyons maintenant ce qui a été généré !

Notre morceau de base et ses suites liées (Part 2)… et à partir de là, dessine-moi un arbre !

La génération fait 03:03 minutes… La première génération fait et fera toujours 4 minutes en version 3.5, alors d’où sortent ces 03:03 minutes ? Eh bien c’est facile : on est parti de notre sample de 00:56 et si on retranche 00:56 à 04:00 eh bien il reste théoriquement  03:04. On m’a encore carotté une seconde ? C’est bien possible mais je pense plutôt que ça se joue avec les centièmes et que du coup on a l’impression qu’on se fait poutrer une seconde alors que si on additionne les centièmes… Bref, on s’en flatte les fesses de la seconde manquante… Maintenant on va sélectionner l’une ou l’autre piste (voire les deux l’une après l’autre) et on va fabriquer un arbre parce que chaque fois qu’on va étendre un bout de piste, on va créer deux générations possibles… Il y a un moment, ça va devenir un jeu de piste de s’y retrouver avec une version, surtout si on s’amuse à tout générer en parallèle… ça devient vite infernal !

Et on étend la sélection sur le nouveau morceau généré et ainsi de suite !

J’ai choisi la seconde génération… La première m’a surpris à cause de certaines « fausses notes » dans la façon de rendre le solo… Et la rythmique reste sur du 2 temps et c’est chiant. Dans la seconde génération, il y a moins cet effet « fausses notes » et la rythmique est plus proche même si on reste sur du 4… Bref, L’IA a partiellement suivi mon idée et donc maintenant je n’ai plus qu’à étendre cette partie instrumentale en y mettant mon champ. Deux remarques : toutes les générations suivantes feront maximum 2 minutes, ce n’est donc pas la peine de charger tout le texte s’il est long, il vaut mieux couper. D’autre part, j’ai rajouté des éléments de structure à la chanson ; ici ce sont essentiellement des [Verse] soit des couplets mais ça va être dur de claquer un refrain quand la chanson elle-même est une sorte de boucle sur un seul riff qui évolue en rythmique et en complément sonore… Si je devais comparer ça à quelque chose, je dirais que ça se rapproche sur la construction du « Boléro de Ravel » sans en égaler la forme ou la puissance… Mais l’idée est là et on verra ce que ça va donner !

Une fois qu’on a tous les morceaux, on concatène !

La dernière opération c’est quand on a trouvé une fin satisfaisante, on va sur notre dernière partie et on lui dit « Get Whole Song » et il ne reste plus qu’à attendre que ça se passe bien correctement… En principe, il n’y a quasiment jamais d’erreur de génération sauf si on pousse le bouchon un peu trop loin dans une génération. Genre quand on lui demande une version de 25 minutes en 13 morceaux, le père SUNO il te dit « non non non monsieur, c’est pas possible, je timeout à l’exécution parce que c’est trop long et ça encombre mes serveurs… Si tu veux faire du Jethro Tull (This is a Brick, 00:43:46 soit plus de 40 minutes LA chanson) bah tu vas le faire ailleurs parce que je te bug à la face et je vomis ton style de malade mental ». Voilà, c’est dit : on ne peut pas faire des durées monumentales et ça tombe mal parce que j’ai un morceau qui fait… Bon, je vais me taire… « This is an Agglo ». Pour celles et ceux qui savent, voilà l’idée !

Quand tu bandes après avoir lu cet article

Bref, j’ai réussi à boucler deux versions de Metalorganic Silence en mode « à sec et sans crédit » mais c’est ça qui est parfois magique avec SUNO : tu prends un abonnement PRO, tu crames tous tes crédits pour bien rentabiliser l’abonnement et ensuite quand t’es à sec 10 jours après le début du mois tu apprends que SUNO a décidé de filer 50 crédits par jour aux gens fauchés qui ont cramé tous leurs crédits… Mieux : les chansons faites avec ces crédits supp’ comptent comme commercialisable si l’abonnement est actif ! C’est magnifique, parce que ça veut dire que même en rade de cred’ je peux continuer à avancer tous les jours un peu plus vers la réalisation de mon objectif ! MERCI SUNO !!!