Toutes les ressources

Clonage vocal


Le clonage vocal consiste à utiliser l'apprentissage automatique pour construire un modèle synthétique de la voix d'une personne précise, afin de générer une nouvelle parole dans cette voix à partir d'un texte écrit ou de l'interprétation enregistrée d'un autre comédien.[1] Les systèmes modernes reposent sur des réseaux de neurones profonds qui apprennent le timbre, le rythme et la prononciation d'un locuteur à partir d'enregistrements de référence, puis reproduisent ces caractéristiques sur de nouveaux contenus ; la quantité et la qualité de l'audio de référence influent fortement sur la fidélité du résultat.

En production médiatique, le clonage vocal facilite le remplacement de dialogues, la localisation et la recréation de voix autrement indisponibles, y compris des archives. Parce que cette technologie peut imiter de façon convaincante des personnes réelles, elle soulève des questions juridiques et éthiques sur le consentement, les droits à l'image et les deepfakes audio, ce qui a suscité à la fois des recommandations sectorielles et une législation émergente.[2] Les flux de travail responsables associent donc le processus technique à une autorisation explicite du comédien et à une divulgation claire.[3]