
Résumé de l’article précédent
Des fois j’ai l’impression d’être absurde et inconsistant dans ce que je raconte… Et ce qui provoque cette sensation ? le fait que je sois capable de parler d’une chose et de dévier pendant tout un article avant d’y revenir au suivant. Alors je voulais vous raconter les avatars de ma vie chez les stars (comme le chantait feu Corbier dans « la galère capitaine » que je vous recommande)… Ou plutôt mes mésaventures en tant que créateur de contenu original avec l’intelligence artificielle mais avant qu’on y arrive, j’ai eu envie de vous montrer comment on « travaille » avec la matière première.
Et puis, pour une fois que j’ouvre ma porte pendant la phase créative et que je donne des explications qui pourraient avoir un quelconque intérêt, vous pourriez quand même faire semblant de vous y intéresser, bande de sagouins… Ah, si, quand même ? Ça commence à vous plaire parce que vous voyez un peu plus de concret mais vous trouvez ça dommage que jusqu’à maintenant je n’ai rien fait écouter de tout ce que j’ai généré ? Vous avez raison : on va faire un peu d’écoute par rapport à ce qu’on a dans les versions alternatives dans cet article.
Auparavant, on va encore un peu parler technique et organisation parce que ça va être important par la suite et plus tôt on comprend les mécaniques, plus tôt on arrive à se familiariser avec et à ne pas se planter… Parce que oui, il y a matière à plantage et croyez-moi ça va vite ! Alors c’est pas toujours très grave mais des fois on peut y perdre quand même pas mal de temps… On a déjà abordé le syndrome « This is an Agglo » (les générations de plus de 25 minutes) et on va aller voir les autres conneries à éviter avec SUNO et les questions de format de sortie… Parce que oui, on ne va pas aller se faire mal pour rien !
Et si j’ai encore un peu le temps, je vous en dirais plus sur la suite de mon périple en milieu musical. Rappel : les circuits actuels j’y connais que dalle parce que pendant 15 ans et plus j’ai vécu dans une grotte avec ma gratte, mon PC et une connexion internet pas nette. Et puis avec une aversion totale pour les réseaux sociaux, pas facile de s’y intéresser et de suivre les contenus… Pourtant, j’aurais pu prendre le virage à l’époque et devenir un Youtubeur de la première heure vu que j’avais déjà une série de vidéos pour « l’Odyssée de la Connerie » dans laquelle on avait des chapitres comme « fumer tue, mais pas encore assez ».
Bref, on s’éloigne du sujet mais c’est pour dire que les réseaux sociaux et le reste, c’est encore une découverte pour moi en 2024 !
15. Des générations et dégénération
Ouais alors vous allez kiffer quand je vais vous dire que l’IA est capable d’interpréter ce qu’on lui donne comme sample à manger et qu’elle réussit l’exploit à autodétruire une piste qui a un peu de souffle dessus. Comme je vous l’ai peut-être déjà mentionné dans l’article précédent, quand j’ai enregistré mes 3 premiers « PrEvIoUsLy UnReLeAsEd » je l’ai fait avec les moyens du bord et c’était plus avec la bite et le couteau qu’autre chose et encore, le couteau était en option et je ne sais pas si tu as déjà essayé d’enregistrer avec juste ce qu’il reste mais disons que si tu t’appelles pas Rocco Siffredi tu auras du mal à déclencher l’enregistrement ! Plus sérieusement, à l’époque mon matériel d’enregistrement se limitait à sa plus simple expression et forcément les démos ont un son très spécial. Ce que je vous propose, c’est d’en prendre une comme ça à froid et de regarder déjà ce que ça donne à l’origine. On va prendre « Cathedral » pour faire un essai. Voilà la démo d’origine :
C’est bien précisé « son de merde de la démo d’origine » dessus… C’est une A.O.C. !
Bon, alors évidemment, quand c’est comme ça il faut déjà commencer par traiter le bout de sample pour l’équilibrer un peu : première étape, on passe un coup de compresseur dessus pour éliminer en grande partie la saturation et si ça ne suffit pas on réduit de 2 décibels en 2 décibels à l’aide de notre ami AUDACITY et de ses effets embarqués qui vont permettre une autre prouesse technique : l’équilibrage des basses et des aigus. Parce que oui, dans « Cathedral » on a la basse qui sature à mort et la guitare fait office de moustique asthmatique qui agonise péniblement dans les aigus. On a donc une possibilité dans AUDACITY d’aller modifier un peu le son pour notre sample, ce qui va donner à peu près ceci :
Le même en retravaillé…
Alors malgré tous les essais et bidouillages qu’on peut faire avec les effets, quand la saturation fait à ce point « corps » avec la démo d’origine et qu’on n’a que ça à lancer pour alimenter la machine eh bah déjà c’est pas brillant mais ensuite ça pose quelques problèmes parce que comme je l’ai déjà dit précédemment l’intelligence artificielle va analyser le morceau et pour elle ça va être très clair : la saturation fait partie du morceau et donc il va falloir reproduire de la saturation, quitte à ce que ça nique complètement la génération après ! J’ai quelques exemples de pistes qui se sont retrouvées en mode « destroy » comme ça et quand tu en écoutes certaines tu as l’impression que l’IA a mangé la version pour ensuite la vomir et la remanger à l’instar d’un certain Steve-O dans une émission appelée Jackass… J’avoue, j’ai été cherché le *.gif sur Tenor.com et je ne l’ai pas trouvé (fort heureusement). Donc, voilà ce que donne de la purée vomitive audio quand on part d’une démo avec un son un peu trop crade :
Une génération complète avec un son dégueulasse en entrée !
Alors premier commentaire, c’est que l’entrée telle que je la lui donne est légèrement modifiée et encore plus dégueulasse qu’à l’origine (si si, c’est possible). Alors pourquoi ? Simplement parce que mon format d’entrée est compressé en MP3 et même si c’est du 128 Kbit/s voire du 192 Kbit/s il y a quand même une légère perte de qualité que SUNO va amplifier un petit peu… Ça plus la saturation, on est quasiment certain d’avoir une piste encore plus dégueulasse en sortie… Et pourtant, la version de « Cathedral » elle torche ! Elle utilise bien le son du sample pour construire le reste de la chanson et avec les paroles ça le fait mais putain qu’est-ce que ça tue les oreilles la saturation ! Arf, c’est affreux mais voilà qui illustre une loi bien connue en informatique et qui peut s’appliquer dans la vie de tous les jours : « quand tu donnes de la merde en entrée, il faut pas t’attendre à récupérer autre chose que de la merde en sortie… sinon c’est de l’alchimie ».
Quand l’IA se met à déconner pendant la génération !
De plus en plus souvent je suis confronté à ce phénomène d’emballement de l’IA dans SUNO… Il commence une piste tranquillement avec un son correct et écoutable sans le moindre souffle et la moindre saturation et d’un coup il génère une piste sursaturée et bordélique dans laquelle il y a plein de choses en superposition, un véritable chaos audio dans lequel on ne comprend plus rien. D’aucuns diront qu’à choisir des sonorités exotiques entre le « doom metal » et le « sludge metal » voire les deux ensemble avec une option « Dark » on arrive facilement à obtenir ce genre de choses mais je me l’explique quand même difficilement, surtout quand la partie précédente voire les parties précédentes sont clean ! Il ne faudrait pas non plus prendre les enfants du bon Dieu pour des canards sauvages, non mais ! Bref, ça consomme 5 crédits pour rien et c’est inexploitable…
Quand l’IA se met à rajouter des trucs improbables en fin de génération…
Il y a aussi le summum de l’incompréhension pour moi. Tu as généré ta piste et à la fin tu te retrouves avec des gens qui parlent, qui racontent des inepties inintelligibles ou, comme ici, un psychopathe qui fait une crise d’angoisse alors que concrètement… Bah « what the fuck » quoi ? Et si ça finit pas en crise d’asthme en temps réel on a de la chance… Appelez le SAMU, j’ai un mec qui meurt sur la génération de ma piste ! Non mais sérieusement, il faut s’attendre à ce que ça arrive de temps à autres et dans ce cas être sans pitié : si le début vous plaît et qu’on vous a balancé de la merde hors contexte en fin de piste qui vous pourrit l’enregistrement, la seule possibilité de récupérer la piste c’est de faire [Extend] à partir du dernier endroit où le son est bon. Ça va vous coûter 10 crédits mais au moins le début de la piste sera exploitable. Si par malheur ça arrive en début de piste, jetez ça dans la poubelle et faites comme si ça n’avait jamais existé. Certains disent que ce sont des « restes » de l’entraînement du modèle de l’IA qui ressortent de temps à autres. Do we have a ghost in the shell ?
…ou à nous arnaquer sur la durée de la génération !
Autre phénomène plus que frustrant mais extrêmement rare : le foutage de gueule Made in SUNO ou « et si on générait une piste de 1 minute et 49 secondes histoire de dire qu’on a presque approché des deux minutes pour la génération mais qu’on laissait genre 1 minutes et 4 seconde de blanc dans la piste ? Est-ce que ce ne serait pas fun pour cacher une chanson ou faire une autre connerie du genre » ? Et je suis au regret de dire que la réponse est « NON » parce que c’est pénible d’avoir un vide de plus d’une minutes sur une chanson… C’est comme le fait de ne pas être capable de finir un morceau alors que la commande clef [End] a déjà été envoyé 3 ou 4 fois dans les paroles et que l’IA persiste et signe en disant « non bah non, je ne vais pas m’arrêter en si bon chemin ! Je vais continuer à générer et à consommer ton crédit pour rien jusqu’à ce que tu arrêtes de cliquer dessus et si jamais tu me dis Get Whole Song je plante juste pour voir ta tronche d’ahuri en train de pester parce que c’est du gros foutage de gueule… ». Vous n’y croyez pas ? Parfois je soupçonne l’IA de tenter de rendre les gens fous en n’écoutant pas les consignes données… Je vous jure que des fois, c’est affolant tellement c’est… voilà quoi !
Cela dit, si je dois avancer un chiffre en termes de pourcentage de malfaçon des pistes générées par l’IA, je dirais que selon la période on se trouve entre 10 et 20% de déchets au grand max et que ça dépend essentiellement des styles que l’on utilise. De toute façon, SUNO a déjà prévu : « Less is better » donc moins tu mets d’indications, plus tu laisses de liberté à l’intelligence artificielle pour qu’elle te fasse une belle génération… Après si tu viens avec des mélanges exotiques au niveau sonore (genre fais-moi de la « hardtech poetry rap oumpapa metal symphonic speedcore ») il est clair que tu augmentes mécaniquement les chances de produire une bouillie sonore en plus d’une véritable bouse cosmique… Je ne dirais pas que j’ai testé mais c’est tout comme… Déjà lui mélanger du « drone, organ, doom gothic, dark » même si ça reste dans la même veine il y a quand même des risques de génération de purée vomitive audio (PVA) qui ne sont pas moindres et qui sont nettement plus présents que lorsqu’on met simplement « Rock Alternative, Dark » ou « Heavy Metal, Dark ».

Avoue, toi aussi tu aimes le côté obscur…
En même temps quand le pseudo du type qui compose c’est « THE DARKERS » tu ne vas pas faire spécialement du Rock Chrétien… Tu pourrais, mais essentiellement ta matière première est « Dark » et donc c’est un peu normal si tu en retrouves partout (de la « Dark Matter »). Bref, comme je le disais parfois j’ai des surprises lors de la génération et j’en perd une au passage. Si c’est celle dès la première génération bah ça complique un peu la constitution de l’arbre fabriqué à partir de plusieurs morceaux mais dans ce cas il y a toujours la possibilité de générer à partir de la branche précédente donc ce n’est pas si grave… Faut juste pas être en rade de crédits sinon forcément c’est frustrant mais autrement bah « shit happens » comme on dit ! Comme je le disais, ça reste quand même assez exceptionnel d’avoir des générations dégénérées mais pour ça il faut vraiment pousser le système dans ses retranchements et très honnêtement ça m’arrive de temps à autres quand je veux faire une chanson dans un style un peu spécial mais pas tant que ça. L’intelligence artificielle a quand même une bonne capacité à travailler correctement même si parfois elle se ramasse un peu au niveau des paroles… Le français n’est pas sa langue de prédilection et parfois elle déforme quelques mots, d’où le fait d’avoir choisi des générations en anglais ; ça passe quand même vachement mieux, surtout vu les styles musicaux qui ne se prêtent pas forcément à du texte en français…
Bref, maintenant que je vous ai montré un peu le côté obscur de la génération de musique et les erreurs que l’on peut obtenir je vais continuer à vous narrer mes pérégrinations au niveau de mon projet musical. Je vous rappelle brièvement le contexte : Je découvre SUNO, le teste et y voit le potentiel pour recréer un répertoire musical mis de côté durant plus de 16 ans. Le projet initial s’avère titanesque et nécessitera des centaines d’heures de travail mais allez, on va faire ce qu’on rêvait de faire depuis 16 ans et quitte à le faire, autant essayer d’en faire un projet valable qui tient la route et qui permettra de dégager quelques ronds à distribuer dans quelques associations qui me tiennent à cœur. C’est le moyen de donner aussi une utilité pratique à un projet qui sans ça n’en a pas réellement. Pourquoi j’irais concurrencer de vrais musiciens (même si je le suis encore moi-même) avec mon projet qui utilise de l’IA ? Oui, des gens avec un code moral ça existe encore. Cela étant, pour que le projet prenne corps, je suis passé par une plateforme de financement participatif : Ulule. Or, malgré un plan qui n’est pas complètement à la ramasse, l’équipe d’Ulule m’a fait remarquer que ma campagne a de fortes chances d’être un échec retentissant si je n’ai personne pour soutenir mon projet. Niveau famille et amis c’est vrai que je suis un peu léger donc il va falloir que je gagne en popularité… Or, la pleine lumière quand on a choisit « THE DARKERS » en pseudo… Comment dire ? Faites-vous votre idée vous-même !
16. En route vers la popularité !
Bien, alors on en est là : j’ai demandé à Google et ChatGPT et Copilot ce qu’ils me suggéraient pour acquérir de la popularité et créer une communauté fédératrice autour de mon projet. J’ai obtenu à peu près la même réponse partout : « mec, y’a pas de secret. Déjà il faut que tu distribues ta musique le plus possible, et ensuite que tu sois présent. Fais un site web dans lequel tu te présentes et tu présentes tes travaux, sors tes musiques, fais du teasing, utilise les réseaux sociaux le plus possible, créé ta chaîne YouTube, fais une newsletter… Bref, sois le plus présent possible quasiment partout où tu le peux. Mets-toi en avant et travaille sur ton image. Évite le plus possible le bad buzz et les conneries qui vont te desservir et arrête d’écrire des articles remplis de phrases qui contiennent des vulgarités, des obscénités ou des mots de vocabulaire qui nécessitent un dictionnaire… Bref, sois accessible mais n’en fais pas trop non plus ». Waouh… tout ça ? Alors oui et non… En fait j’ai développé ce que mes « conseillers » ont résumé en quelques points sur une « bullet list » mais franchement on n’est pas loin du tout de ce qu’ils auraient pu me dire s’ils avaient été des conseillers humains. Après, je me dis que la checklist est là et que je n’ai qu’à m’en servir pour tenter de me recréer une image… Bah ouais parce que populaire j’ai pu l’être de 2003 à 2007 quand je produisais seul « Les Aventuriers du Château de Morenbach » dans un contexte où il y avait encore peu de sagas MP3 (on devait être 5 ou 6 au départ) jusqu’à l’explosion des sagas MP3 et leur abandon quasiment total et définitif à l’arrivée de YouTube. Donc, je sais ce que ça fait de se faire critiquer, insulter ou troller en live… mais aussi ce qu’on ressent quand les gens vous remercient pour le travail que vous faites et quand ils vous disent que vos conneries les ont bien fait marrer !

Oui enfin, pas tant que ça hein…
Bref, le but ici n’est pas de devenir une superstar mais juste d’arriver à convaincre quelques personnes (quelques centaines voire quelques milliers quand même… et c’est déjà énorme à faire) du bien-fondé de ce que je fais sachant que les goûts et les couleurs… Voilà quoi ! En plus de ça, le projet va nécessairement diviser puisque tu as celles et ceux qui vont crier au scandale et qui vont dire « Il triche, il utilise de l’Intelligence Artificielle, c’est pas de la vraie musique, c’est du fake ! il cherche à nous enturbanner ! » et les autres qui vont dire « Bah, après tout pourquoi pas ? Le gars utilise les dernières technos pour faire revivre sa propre discographie et partager ce qu’il a fait, ça pose quoi comme problème ? ». Donc on est d’accord sur le principe : on va certainement avoir une partie des gens qui vont littéralement chier sur le projet tel qu’il est présenté pour différents motifs… Reste à savoir s’ils constituent une majorité ou une minorité de personne du public… Et ça je ne le saurais que lorsque j’aurais lancé les premiers singles… Parce que oui, c’est déjà en route !
Alors c’est en route, mais ça ne va pas se faire tout de suite… J’ai programmé à 4 semaines la première sortie et j’ai croisé les doigts. Mais comment j’en suis arrivé là ? Eh bien j’ai commencé par relire un peu les conditions de TuneCore et je me suis dit « Ok, je peux tranquillement débourser 39 € par an pour un abonnement semi-pro vu que je vais avoir une amplitude de 3 ans pour sortir tous mes albums à fréquence régulière. Accessoirement je peux déjà souscrire également à l’option TuneCore Publishing même si je ne peux pas l’utiliser pour le moment… ». Ah oui mais ça faut que j’explique parce que ça vaut son pesant de cacahuètes ! Alors niveau droit, SUNO vous recommande de vous protéger et de protéger votre musique. J’ai dit que la SACEM était pas chaude pour l’IA ? C’est toujours d’actualité mais mais mais, j’ai reçu une réponse qui change un peu les données du problème et que je vais vous partager ici (juste la réponse).
Finalement, la SACEM n’est peut-être pas aussi rigide et fermée que je le pensais… Ont-ils besoin de sous ?
Du coup, quand je lis ça, ça me tente bien d’aller me faire SACEMiser mais il est possible que je me fasse SACEMettre parce que ça va dépendre de l’appréciation des sociétaires en face et payer 100 balles pour qu’on me dise « euh ouais, gros… t’es gentil mais quand tu fais juste le texte de la zik ton apport personnel c’est peau de balle quoi ! ». Encore que ? Ils protègent bien les textes des paroles donc… ça pourrait passer (j’ai fait un texte enrobé de musique généré par l’IA. Si on le considère comme texte ça passe ou je peux faire croire que c’est une chanson ?). Bon, j’avoue, je marche sur des œufs et c’est peut-être pas le moment de faire du second degré, d’être cynique ou de faire de l’ironie… n’empêche qu’avec l’IA c’est toujours un peu le sujet visqueux et glissant qui apparaît comme difficile à poser sur la table vu le vide législatif, les controverses et l’avis général des musiciens qui te disent « non mais l’IA ça remplace pas des humains » alors qu’en fait c’est pas ce qu’on lui demande : on lui demande juste de servir d’interface pour générer la musique qu’on ne peut pas ou plus faire en groupe à partir de ce qu’on a soi-même déjà préparé. En tout cas c’est valable pour moi… Mais pour en revenir à la SACEM, j’ai envie de dire qu’outre les 100 balles que ça va coûter, il y a aussi les conditions d’adhésion qui sont un poil pénible :
Les conditions nécessaires pour justifier d’une adhésion.
Il n’y a encore pas si longtemps, les conditions étaient un poil plus complexes que celles-ci mais déjà là ça va être compliqué dans l’immédiat. Explication : Une capture d’une chaîne YouTube avec au moins un millier de vues bah… va falloir créer la chaîne, l’alimenter et la populariser et très honnêtement avec ma vie de famille et mon boulot ça va être compliqué de réserver du temps pour faire des vidéos quand la plupart des YouTubeurs n’ont quasiment que ça à foutre de la journée dans la mesure où ils vivent sur la monétisation de leur chaîne et donc du contenu qu’ils produisent. Alors attention, je ne dis pas qu’ils se branlent les couilles à longueur de journée… loin de là ! En fait, ils vont passer des heures à soigner le montage, les prises, à mixer… Un peu à la façon dont on fait un court métrage et honnêtement, c’est consommateur niveau heures. Même pour faire une vidéo de 1 minute max au format Tik Tok ça peut prendre un temps de dingue ! Alors moi qui écrit déjà mes articles la nuit sur mes heures de sommeil, s’il faut que je me farcisse une chaîne YouTube c’est mort… Et pourtant, je vais devoir le faire quand même mais j’y reviendrais…
Une copie recto verso de la jaquette du CD, du Vinyle ou du DVD. Ce serait super facile à faire vu que je suis déjà en train de faire mon artwork moi-même pour la campagne de financement participatif sur Ulule… Bon, après le graphisme c’est pas ma tasse de thé : je sais faire mais je n’excelle pas dans la maîtrise de Photoshop ou autres outils… Pour le moment c’est Copilot qui s’occupe de générer les horreurs que je lui demande de créer et ça va plutôt bien pour faire des pochettes… Maintenant, faire un livret complet c’est pas si simple que ça et donc il se pourrait que je m’attache les services d’un/une graphiste ou de quelqu’un qui bricole un peu plus que moi dans le domaine pour sortir un truc qui soit un peu plus classe que l’immonde torchon que je suis en train de préparer… Mais s’il suffisait de balancer la pochette ce serait très facile, sauf que ce qu’on me demande en plus (et c’est pas marqué dessus) c’est le code barre généré lors de la production de l’œuvre en vue de sa commercialisation. Et là, évidemment, ça va tout de suite être plus compliqué étant donné que je vais d’abord faire du numérique sur les plateformes pour me faire connaître, créer une communauté (ou essayer en tout cas) et ensuite lancer le projet de financement participatif qui me permettra de faire du format physique. C’est donc pas pour tout de suite…
L’attestation de diffusion, pour le moment c’est « même pas en rêve » parce que ça m’étonnerait que mes œuvres commencent à être diffusées à la télé et à la radio… Quant à faire des concerts et des spectacles je pense qu’on peut oublier ! On va donc se rabattre sur la dernière possibilité : La diffusion sur une plateforme de streaming… Et là, il va falloir se mettre à faire des prières voire des incantations parce que mon premier titre « Truth » sort le 30 septembre (le temps que les plateformes intègrent mon profil et mes infos) et que s’il est passé sur TuneCore, ces derniers me garantissent la distribution vers les plateformes mais pas le fait que les plateformes acceptent de diffuser ou non mon morceau (en fait mes morceaux, j’ai envoyé ça en groupe de 3 façon EP). Après j’ai packagé au mieux et j’ai suivi toutes les consignes mais on ne sait jamais. Donc résumons-nous : J’ai pris un abonnement à TuneCore en semi-pro à 39 € / an pour des sorties illimitées et j’ai souscrit au service TuneCore Publishing pour récupérer l’ensemble de mes droits mais pour que le service TuneCore Publishing soit actif, il me faut un numéro d’identifiant de la SACEM (donc lâcher 100 balles mais c’est une fois dans une vie, ça va) que je n’aurais que si mes morceaux sont diffusés sur une plateforme de streaming et que je peux en apporter la preuve. Qui a dit que j’aimais vivre dangereusement ? En fait, tout est conditionné et je me suis laissé du temps pour pouvoir réaliser toutes les autres opérations que je vais avoir à réaliser ensuite… Vous allez voir, il y a de quoi faire ! Pas simple de créer et distribuer sa propre musique quand on n’y connaît rien ou presque…

