全部资源

文本转语音(TTS)


文本转语音,即 TTS,是一种将书面文本转换为语音音频的技术,属于语音合成的一种形式。[1]现代系统利用机器学习来生成具有恰当节奏和语调的自然听感人声,并能按需朗读任意文本。

在媒体和产品工作中,TTS 被用于无障碍辅助、语音界面、对白快速原型设计,以及需要大规模生成或更新的内容。设计良好的 TTS 体验涉及选择音色、调校发音,并对系统进行集成,使其输出能够自然融入周围的音频之中。[2]