すべてのリソース

テキスト音声合成(TTS)


テキスト音声合成、すなわちTTSとは、書かれたテキストを音声に変換する技術であり、音声合成の一形態です。[1] 現代のシステムは機械学習を用いて、適切なリズムとイントネーションを備えた自然な響きの声を生成し、要求に応じて任意のテキストを読み上げることができます。

メディアやプロダクトの分野では、TTSはアクセシビリティ、音声インターフェース、セリフの迅速なプロトタイピング、そして大規模に生成・更新しなければならないコンテンツに利用されています。優れたTTS体験を設計するには、声を選び、発音を調整し、その出力が周囲のオーディオに自然になじむようにシステムを統合することが求められます。[2]