Aprendizaje profundo para audio
El aprendizaje profundo para audio aplica redes neuronales de muchas capas a tareas como el reconocimiento, la generación y la transformación del sonido.[1] Al aprender patrones a partir de grandes cantidades de datos de audio, estos modelos pueden realizar trabajos que antes eran difíciles de programar de forma directa, como la síntesis de voz, la separación de fuentes y la reducción de ruido.
Las mismas técnicas impulsan la clonación de voz, la música generativa y las herramientas de audio inteligentes, y siguen avanzando con rapidez. Aplicarlas bien requiere datos de entrenamiento adecuados, una evaluación cuidadosa y atención a las cuestiones éticas que surgen cuando los modelos pueden imitar de manera convincente voces y sonidos reales.[2]