Все ресурсы

Клонирование голоса


Клонирование голоса — это использование машинного обучения для построения синтетической модели голоса конкретного человека, благодаря чему новую речь можно генерировать этим голосом из письменного текста или из записанной подачи другого исполнителя.[1] Современные системы опираются на глубокие нейронные сети, которые по эталонным записям обучаются тембру, ритму и произношению говорящего, а затем воспроизводят эти черты в новом материале, и объём и качество эталонного аудио сильно влияют на то, насколько достоверно звучит результат.

В медиапроизводстве клонирование голоса применяется для замены диалога, локализации и воссоздания голосов, которые иначе недоступны, включая архивные материалы. Поскольку технология способна убедительно имитировать реальных людей, она поднимает правовые и этические вопросы о согласии, правах на образ и аудиодипфейках, что привело как к появлению отраслевых рекомендаций, так и к формирующемуся законодательству.[2] Поэтому ответственные рабочие процессы сочетают технический процесс с явным разрешением исполнителя и прозрачным раскрытием информации.[3]