Synthèse de la parole
La synthèse de la parole est la production artificielle de la parole humaine par un système informatique.[1] Les premières approches assemblaient la parole à partir de fragments enregistrés ou modélisaient directement le conduit vocal, tandis que les systèmes contemporains utilisent des réseaux de neurones profonds pour générer des formes d'onde qui ressemblent étroitement à un locuteur naturel.
La qualité de la parole synthétisée se juge à son intelligibilité et à son naturel, y compris la justesse de l'accentuation, du rythme et de l'émotion. La synthèse de la parole est le fondement du text-to-speech, des assistants vocaux et de nombreux outils d'accessibilité, et c'est la base sur laquelle reposent des techniques plus spécialisées comme le clonage vocal.[2]