Tutte le risorse

Clonazione Vocale


La clonazione vocale è l'utilizzo del machine learning per costruire un modello sintetico della voce di una persona specifica, in modo da poter generare nuovo parlato con quella voce a partire da testo scritto o dalla registrazione dell'interpretazione di un altro performer.[1] I sistemi moderni si basano su reti neurali profonde che apprendono il timbro, il ritmo e la pronuncia di un parlante a partire da registrazioni di riferimento, per poi riprodurre tali caratteristiche su nuovo materiale, e la quantità e la qualità dell'audio di riferimento influenzano fortemente quanto fedele risulti il risultato.

Nella produzione di media, la clonazione vocale supporta la sostituzione dei dialoghi, la localizzazione e la ricreazione di voci altrimenti non disponibili, incluso il materiale d'archivio. Poiché la tecnologia può imitare in modo convincente persone reali, solleva questioni legali ed etiche riguardo al consenso, ai diritti d'immagine e ai deepfake audio, il che ha portato sia a linee guida del settore sia a una legislazione emergente.[2] I flussi di lavoro responsabili abbinano quindi il processo tecnico a un'autorizzazione esplicita del performer e a una chiara informativa.[3]