This thesis describes the study of Machine Learning techniques for the optimization of digital filters for Multipoint Audio Equalization and Personal Sound Zones (PSZ) in a car scenario. Multipoint Audio Equalization is a topic that aims to improve the audio quality in a loudspeaker system using digital filters. The Personal Sound Zones is a task that allows the reproduction of different sounds in several regions contained within a listening environment where multiple listeners are present. An up-to-date state of the art on digital filter design, Multipoint Audio Equalization and PSZ techniques have been reported in this thesis. Neural network-based optimization techniques, referred to as Deep Optimization, proved to be the best performing and the most analyzed methods within the proposed approaches. The technique exploits neural networks to iteratively optimize the filter parameters using the feed-forward and backpropagation, updating the weights with an optimizer. A new Deep Optimization architecture has been analyzed, called Bias Network (BiasNet), which uses the bias terms as input and updates its weights to obtain the optimal filters. Experiments for Multipoint Audio Equalization with FIR filters were performed within various automotive scenarios, achieving better results than the state-of-the-art techniques. Other experiments were carried out with Parametric IIR filters, achieving better performance than baseline IIR and FIR filter design methods. Furthermore, analyzing the computational cost, Parametric IIR filters require less operations and memory. Finally, experiments were conducted to design FIR and Parametric IIR filters for PSZ, introducing regularization and penalty terms to eliminate artefacts generated by FIR filters. The results are very promising, achieving a high acoustic contrast keeping high sound quality. IIR filters achieved comparable results with a lower computational cost than FIR filters.
Questa tesi descrive lo studio di tecniche di Machine Learning per l'ottimizzazione di filtri digitali per l'Equalizzazione Audio Multipunto e la Personal Sound Zones (PSZ) all'interno di uno scenario automotive. L'Equalizzazione Audio Multipunto è un argomento che mira a migliorare la qualità audio in un sistema di altoparlanti utilizzando filtri digitali. La Personal Sound Zones è un task che permette la riproduzione dei suoni in diverse regioni contenute in un ambiente d'ascolto dove sono presenti più ascoltatori. In questa tesi, è stato riportato uno stato dell'arte aggiornato sulla progettazione di filtri digitali, tecniche di Equalizzazione Audio Multipunto e di PSZ. In questa dissertazione, le tecniche di ottimizzazione basate sulle reti neurali, denominate Deep Optimization, hanno dimostrato di essere le più performanti tra i metodi proposti. L'approccio sfrutta le reti neurali per ottimizzare iterativamente i parametri dei filtri utilizzando la feed-forward e la backpropagation e aggiornando i pesi con un ottimizzatore. È stata analizzata una nuova architettura di ottimizzazione profonda, chiamata Bias Network (BiasNet), la quale utilizza i termini di bias come input e aggiorna i suoi pesi per ottenere i filtri ottimali. Gli esperimenti per l'equalizzazione audio con filtri FIR sono stati eseguiti all'interno di vari scenari automotive, ottenendo risultati migliori rispetto alle tecniche presenti nello stato dell'arte. Altri esperimenti sono stati eseguiti con i filtri Parametrici IIR, ottenendo prestazioni migliori rispetto alle tecniche di progettazione dei filtri IIR e FIR. Infine, analizzando il costo computazionale, i filtri IIR Parametrici richiedono meno operazioni e meno memoria. Infine, sono stati condotti esperimenti per progettare filtri FIR e IIR parametrici per PSZ, introducendo termini di regolarizzazione e penalità per eliminare gli artefatti generati dai filtri FIR. I risultati sono molto promettenti, ottenendo un alto contrasto acustico mantenendo una qualità del suono alta. I filtri IIR hanno ottenuto dei risultati comparabili con un costo computazionale inferiore rispetto ai filtri FIR.
Deep Optimization of Discrete Time Filters for Listening Experience Personalization / Pepe, Giovanni. - (2022 Mar 04).
Deep Optimization of Discrete Time Filters for Listening Experience Personalization
PEPE, GIOVANNI
2022-03-04
Abstract
This thesis describes the study of Machine Learning techniques for the optimization of digital filters for Multipoint Audio Equalization and Personal Sound Zones (PSZ) in a car scenario. Multipoint Audio Equalization is a topic that aims to improve the audio quality in a loudspeaker system using digital filters. The Personal Sound Zones is a task that allows the reproduction of different sounds in several regions contained within a listening environment where multiple listeners are present. An up-to-date state of the art on digital filter design, Multipoint Audio Equalization and PSZ techniques have been reported in this thesis. Neural network-based optimization techniques, referred to as Deep Optimization, proved to be the best performing and the most analyzed methods within the proposed approaches. The technique exploits neural networks to iteratively optimize the filter parameters using the feed-forward and backpropagation, updating the weights with an optimizer. A new Deep Optimization architecture has been analyzed, called Bias Network (BiasNet), which uses the bias terms as input and updates its weights to obtain the optimal filters. Experiments for Multipoint Audio Equalization with FIR filters were performed within various automotive scenarios, achieving better results than the state-of-the-art techniques. Other experiments were carried out with Parametric IIR filters, achieving better performance than baseline IIR and FIR filter design methods. Furthermore, analyzing the computational cost, Parametric IIR filters require less operations and memory. Finally, experiments were conducted to design FIR and Parametric IIR filters for PSZ, introducing regularization and penalty terms to eliminate artefacts generated by FIR filters. The results are very promising, achieving a high acoustic contrast keeping high sound quality. IIR filters achieved comparable results with a lower computational cost than FIR filters.File | Dimensione | Formato | |
---|---|---|---|
Tesi_Pepe.pdf
accesso aperto
Descrizione: Tesi_Pepe
Tipologia:
Tesi di dottorato
Licenza d'uso:
Creative commons
Dimensione
11.46 MB
Formato
Adobe PDF
|
11.46 MB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.