Tutte le risorse

Deep Learning per l'audio

Il deep learning applicato all'audio impiega reti neurali con molti livelli per compiti come il riconoscimento, la generazione e la trasformazione del suono.^[1] Apprendendo schemi da grandi quantità di dati audio, questi modelli possono svolgere operazioni un tempo difficili da programmare direttamente, tra cui la sintesi vocale, la separazione delle sorgenti e la riduzione del rumore.

Le stesse tecniche alimentano la clonazione vocale, la musica generativa e gli strumenti audio intelligenti, e continuano a progredire rapidamente. Applicarle bene richiede dati di addestramento adeguati, una valutazione attenta e attenzione alle questioni etiche che sorgono quando i modelli sono in grado di imitare in modo convincente voci e suoni reali.^[2]

Torna alla home di DFAD

Deep Learning per l'audio

Potrebbe interessarti anche