Todos los recursos

Conversión de texto a voz (TTS)


La conversión de texto a voz, o TTS, es una tecnología que convierte texto escrito en audio hablado, una forma de síntesis de voz.[1] Los sistemas modernos utilizan aprendizaje automático para producir voces de sonido natural con el ritmo y la entonación adecuados, y pueden leer en voz alta cualquier texto a petición.

En el trabajo de medios y productos, el TTS se utiliza para la accesibilidad, las interfaces de voz, la creación rápida de prototipos de diálogo y el contenido que debe generarse o actualizarse a gran escala. Diseñar una buena experiencia de TTS implica elegir voces, ajustar la pronunciación e integrar el sistema para que su salida encaje de forma natural en el audio circundante.[2]