Toutes les ressources

Synthèse vocale (TTS)


La synthèse vocale, ou TTS, est une technologie qui convertit du texte écrit en audio parlé, une forme de synthèse de la parole.[1] Les systèmes modernes utilisent l'apprentissage automatique pour produire des voix au son naturel, dotées d'un rythme et d'une intonation appropriés, et ils peuvent lire à haute voix n'importe quel texte à la demande.

Dans les domaines des médias et des produits, le TTS est utilisé pour l'accessibilité, les interfaces vocales, le prototypage rapide de dialogues et les contenus qui doivent être générés ou mis à jour à grande échelle. Concevoir une bonne expérience de TTS implique de choisir des voix, d'ajuster la prononciation et d'intégrer le système de sorte que sa sortie s'insère naturellement dans l'audio environnant.[2]