全部资源

语音合成

语音合成是由计算机系统人工生成人类语音的技术。^[1]早期方法通过拼接录制片段或直接对声道进行建模来构建语音,而当代系统则使用深度神经网络生成与自然说话者极为相似的波形。

合成语音的质量取决于其听感的可懂度和自然度,包括正确的重音、时序和情感。语音合成是文本转语音、语音助手以及众多无障碍工具的基础,也是声音克隆等更专门技术得以构建的根基。^[2]

返回 DFAD 首页

您可能也感兴趣