전체 자료

텍스트 음성 변환(TTS)


텍스트 음성 변환, 즉 TTS는 작성된 텍스트를 음성 오디오로 변환하는 기술로, 음성 합성의 한 형태이다.[1] 최신 시스템은 머신러닝을 활용해 적절한 리듬과 억양을 갖춘 자연스러운 목소리를 만들어 내며, 요청에 따라 임의의 텍스트를 소리 내어 읽을 수 있다.

미디어 및 제품 작업에서 TTS는 접근성, 음성 인터페이스, 대사의 신속한 프로토타이핑, 그리고 대규모로 생성하거나 갱신해야 하는 콘텐츠에 사용된다. 우수한 TTS 경험을 설계하려면 목소리를 선택하고, 발음을 조정하며, 그 출력이 주변 오디오에 자연스럽게 어울리도록 시스템을 통합하는 과정이 필요하다.[2]