Les entreprises à la pointe de la technologie vocale de l’IA se demandent comment réglementer les deepfakes sans étouffer l’innovation.
« Ce sera un jeu du chat et de la souris », a déclaré à The Atlantic Mati Staniszewski, cofondateur et PDG d'ElevenLabs.
ElevenLabs – qui a atteint une valorisation de 1,1 milliard de pounds après son lancement en edition bêta l'année dernière – utilise l'IA pour générer des clips audio convaincants. Cela inclut la synthèse vocale, le doublage audio dans 29 langues et le clonage de voix. La société affirme que ses utilisateurs ont généré in addition de 100 ans d’audio au cours de l’année écoulée.
Cependant, les législateurs craignent que cette technologie présente un dangereux potentiel d’abus.
Les progrès de l’IA sont corrélés à une augmentation des escroqueries téléphoniques survoltées dans lesquelles les fraudeurs imposteurs se présentent comme des intérêts amoureux, des membres de la famille ou des représentants du gouvernement. Le chef de l'IA de Biden, Bruce Reed, a même déclaré que le « clonage vocal » était la seule selected qui l'empêchait de dormir la nuit.
Et l'année dernière, les utilisateurs de 4chan ont exploité l'outil d'ElevenLabs pour générer des deepfakes de célébrités crachant du contenu raciste et transphobe, selon Vice.
Mais Staniszewski est un idéaliste.
Il considère que la technologie d'ElevenLabs contribue à un monde dans lequel les patients atteints de maladies neurodégénératives comme la SLA peuvent toujours communiquer par leur voix même après avoir perdu la capacité de parler. Il peut également servir d’outil pour aider les gens à communiquer à travers les cultures et les langues.
Le maire de New York, Eric Adams, a effectué des appels automatisés en mandarin, en yiddish et en créole haïtien grâce à la technologie ElevenLabs et a déclaré qu'il avait pu toucher davantage de résidents non anglophones de la ville.
Pour capitaliser sur ce potentiel tout en empêchant la fraude, Staniszweski a déclaré que les utilisateurs devraient être capables d'identifier les voix générées par l'IA et les voix humaines. La « vraie resolution », a déclaré Staniszewski à The Atlantic, consiste à filigraner numériquement les voix synthétiques afin que les humains puissent différencier les voix réelles des fausses.
L’entreprise développe la technologie, mais elle ne sera efficace qu’avec la coopération d’autres entreprises. ElevenLabs a signé un accord avec plusieurs autres sociétés d'IA, dont OpenAI, Anthropic, Google et Meta, pour lutter contre les deepfakes lors des élections de 2024.
- ElevenLabs, une entreprise de technologie vocale IA, est confrontée aux deepfakes
- La technologie peut être utilisée à des fins malveillantes, préoccupant les législateurs
- Le PDG d'ElevenLabs a proposé l'utilisation d'un filigrane numérique pour différencier les voix générées par l'IA et les voix humaines