← 全部资源 语音合成 语音合成是由计算机系统人工生成人类语音的技术。[1]早期方法通过拼接录制片段或直接对声道进行建模来构建语音,而当代系统则使用深度神经网络生成与自然说话者极为相似的波形。 合成语音的质量取决于其听感的可懂度和自然度,包括正确的重音、时序和情感。语音合成是文本转语音、语音助手以及众多无障碍工具的基础,也是声音克隆等更专门技术得以构建的根基。[2] 您可能也感兴趣 AI 支持 文本转语音(TTS) → AI 支持 声音克隆 → AI 支持 声音皮肤 → 返回 DFAD 首页