Depuis le début de l’année 2023, une première version du logiciel en bêta a permis aux utilisateurs de faire joujou avec n’importe quelle voix. Une innovation plutôt amusante sur le papier, mais qui fait naître un tout nouveau marché.
L’intelligence Artificielle ElevenLabs évolue
Que vous soyez sur Tik Tok ou YouTube, vous êtes forcément tombé sur une “cover IA” d’une personnalité connue. Johnny Hallyday qui chante le générique de One Piece, ou bien Squeezie qui chante la Bohème… Des nouvelles covers générées par intelligence artificielle apparaissent chaque jour sur les réseaux sociaux. Et pour avoir ce résultat saisissant, les créateurs de ces contenus ont utilisé l’IA de la start-up ElevenLabs.
Spécialisée dans l’IA, ElevenLabs a développé son propre logiciel pour créer de nombreuses choses. Les voix de synthèses sont devenus extrêmement populaires, et même si cela ne date pas d’hier, les évolutions sont plutôt conséquentes. Un discours, une chanson, une poésie, peu importe, l’IA d’ElevenLabs a su s’adapter à la demande, notamment grâce à la puissance du Machine Learning.
ElevenLabs a lancé son logiciel en bêta au début de l’année 2023, mais ce dernier s’est grandement amélioré depuis. Le Machine Learning, comme son nom l’indique, permet à un logiciel de s’améliorer de lui même en apprenant via les demandes des utilisateurs. La start-up avait lancé une levée de fonds en juin 2023 pour un total de 19 millions de dollars, quand l’outil s’est enfin déployé pour le grand public.
Bien sûr, difficile de faire évoluer économiquement cette IA qui se base principalement sur le clonage de voix, une technologie très amusante, mais aussi très controversée. En effet, si certains s’amusent à créer de fausses chansons avec la voix de personnes connues, d’autres tentent de diffuser de faux messages, qu’ils soient politiques ou non, dans un but de désinformation. Et même dans un autre cadre, des chanteurs ne veulent pas que des personnes se fassent de l’argent sur leur dos avec des chansons qu’ils n’ont jamais chanté…
Comme quasiment toutes les technologies, nous connaissons déjà quelques débordements qui nuisent aux créateurs. Typiquement, des utilisateurs des forums de discussion 4Chan se sont emparé des voix de personnalités connues comme Emma Watson ou Ben Shapiro, pour diffuser des messages de haine à grande échelle. Evidemment, ElevenLabs a rapidement réagi à cette polémique en annonçant qu’ils pensaient réserver cette IA uniquement à celles et ceux qui payent un abonnement. Ainsi, cela décourageait les trolls de diffuser massivement ce genre de contenu.
Une industrie qui va connaître énormément de changement
Comme souvent, les pays asiatiques sont en avance dans ces domaines. La société HYBE, détenteur des droits de diffusion du groupe de K-pop BTS a vendu les voix des différents chanteurs à la société Supertone IA. Pourquoi me direz-vous ? Tout simplement pour vendre des extraits de voix aux fans afin de les “réconforter”.
L’industrie musicale voit ces changements comme une immense menace pour les droits de diffusions, mais d’autres sociétés l'imaginent plus comme une opportunité de vendre des “produits dérivés” tout numérique. Evidemment, en dehors de l’industrie musicale, il faut se poser des questions vis-à-vis des problèmes éthiques que cela peut engendrer, notamment du côté des doubleurs professionnels. En effet, nous avons appris depuis peu que le studio de jeux vidéo Hi-Rez, derrière des titres comme Smite ou Paladins, refusent de payer des doubleurs pour leurs prochains titres/ personnages, en affirmant que le doublage par IA était mieux pour eux.