Deep Learning per l'audio
Il deep learning applicato all'audio impiega reti neurali con molti livelli per compiti come il riconoscimento, la generazione e la trasformazione del suono.[1] Apprendendo schemi da grandi quantità di dati audio, questi modelli possono svolgere operazioni un tempo difficili da programmare direttamente, tra cui la sintesi vocale, la separazione delle sorgenti e la riduzione del rumore.
Le stesse tecniche alimentano la clonazione vocale, la musica generativa e gli strumenti audio intelligenti, e continuano a progredire rapidamente. Applicarle bene richiede dati di addestramento adeguati, una valutazione attenta e attenzione alle questioni etiche che sorgono quando i modelli sono in grado di imitare in modo convincente voci e suoni reali.[2]