At present, Ambient Intelligence represents the challenge of the future. To obtain an ecosystem that is fully functional and calibrated to the user need, numerous systems, each of them dedicated to a specific task, must be integrated. One of these sub-systems is the human fall detection. Both research community and governments gave particular attention to the human fall detection because the fall is the first cause of death for people over 65. In this thesis, the human fall detection is addressed from an audio perspective: a dataset named A3FALL, composed of a corpus of several audio fall events of every-day objects and both simulated and real human falls recorded in 3 different rooms, has been presented. In particular, a special floor acoustic sensor (FAS) has been developed from this purpose and used to record the dataset together with an array of a microphone array. Different approaches that work with a different knowledge base according to the specific task have been proposed: first, two supervised approaches have been described that have highlighted the peculiarities of the audio drop detection and demonstrated the effectiveness of the proposed sensor. The human falls hardly available for systems development, unsupervised systems have been proposed that do not need examples of the target class in the learning phase. It has been shown that unsupervised approaches have better performance than the art state systems, but they do work well in not very complex scenarios. Finally, methods that work under more realistic conditions have been developed and described. A system where the user intervenes by correcting the system’s operation for a considerable reduction of false alarms is proposed. Then a few-shot learning approach that without any user intervention can achieve promising results using only a few examples of human fall in the training phase has been presented. The thesis concludes with an extensive evaluation of a Siamese Convolutional Autoencoder based approach. It has been shown that this approach outperforms all the previously proposed systems when assessed in a complex scenario.

L’ Ambient Intelligence rappresenta la sfida del futuro. Per ottenere un ecosis- tema funzionante e calibrato in base alle esigenze dell’utente, necessario inte- grare numerosi sistemi, ciascuno dedicato a un compito specifico. Uno di questi sottosistemi il rilevamento della caduta umana. In questa tesi, il rilevamento delle cadute umane affrontato da una prospettiva audio. In questo lavoro stato presentato un set di dati denominato A3FALL, composto da una serie di diversi eventi audio relativi alla caduta di oggetti comuni e cadute umane, simulate e reali. In particolare, per tale scopo stato sviluppato uno speciale sensore acus- tico a pavimento (FAS) che stato utilizzato per registrare il set di dati insieme ad un array di microfoni. Sono stati proposti differenti approcci che lavorano con una diversa base di conoscenze in base al compito specifico: in primo lu- ogo sono stati descritti due approcci supervisionati che hanno evidenziato le peculiarit del rilevamento della caduta audio e hanno dimostrato l’efficacia del sensore proposto. Per via delle poche cadute umane reali a disposizione per lo sviluppo di tali sistemi, sono stati proposti approcci non supervisionati che non necessitano di esempi della classe target nella fase di apprendimento. stato di- mostrato che gli approcci non supervisionati hanno prestazioni migliori rispetto ai sistemi dello stato dell’arte, ma funzionano bene in scenari poco complessi. Infine, sono stati sviluppati e descritti metodi che funzionano in condizioni pi realistiche. Viene proposto un sistema in cui l’utente interviene correggendo il funzionamento del sistema per una notevole riduzione dei falsi allarmi. Poi viene proposto un approccio di apprendimento one-shot che, senza l’intervento dell’utente, pu ottenere risultati promettenti utilizzando solo alcuni esempi di caduta umana nella fase di addestramento. La tesi si conclude con una valu- tazione approfondita di un approccio basato su un Autoencoder siamese. stato dimostrato che questo approccio migliore di tutti i sistemi precedentemente proposti quando valutatti in scenari complessi.

Ambient Intelligence: Computational Audio Processing For Human Fall Detection / Droghini, Diego. - (2019 Mar 13).

Ambient Intelligence: Computational Audio Processing For Human Fall Detection

DROGHINI, DIEGO
2019-03-13

Abstract

At present, Ambient Intelligence represents the challenge of the future. To obtain an ecosystem that is fully functional and calibrated to the user need, numerous systems, each of them dedicated to a specific task, must be integrated. One of these sub-systems is the human fall detection. Both research community and governments gave particular attention to the human fall detection because the fall is the first cause of death for people over 65. In this thesis, the human fall detection is addressed from an audio perspective: a dataset named A3FALL, composed of a corpus of several audio fall events of every-day objects and both simulated and real human falls recorded in 3 different rooms, has been presented. In particular, a special floor acoustic sensor (FAS) has been developed from this purpose and used to record the dataset together with an array of a microphone array. Different approaches that work with a different knowledge base according to the specific task have been proposed: first, two supervised approaches have been described that have highlighted the peculiarities of the audio drop detection and demonstrated the effectiveness of the proposed sensor. The human falls hardly available for systems development, unsupervised systems have been proposed that do not need examples of the target class in the learning phase. It has been shown that unsupervised approaches have better performance than the art state systems, but they do work well in not very complex scenarios. Finally, methods that work under more realistic conditions have been developed and described. A system where the user intervenes by correcting the system’s operation for a considerable reduction of false alarms is proposed. Then a few-shot learning approach that without any user intervention can achieve promising results using only a few examples of human fall in the training phase has been presented. The thesis concludes with an extensive evaluation of a Siamese Convolutional Autoencoder based approach. It has been shown that this approach outperforms all the previously proposed systems when assessed in a complex scenario.
13-mar-2019
L’ Ambient Intelligence rappresenta la sfida del futuro. Per ottenere un ecosis- tema funzionante e calibrato in base alle esigenze dell’utente, necessario inte- grare numerosi sistemi, ciascuno dedicato a un compito specifico. Uno di questi sottosistemi il rilevamento della caduta umana. In questa tesi, il rilevamento delle cadute umane affrontato da una prospettiva audio. In questo lavoro stato presentato un set di dati denominato A3FALL, composto da una serie di diversi eventi audio relativi alla caduta di oggetti comuni e cadute umane, simulate e reali. In particolare, per tale scopo stato sviluppato uno speciale sensore acus- tico a pavimento (FAS) che stato utilizzato per registrare il set di dati insieme ad un array di microfoni. Sono stati proposti differenti approcci che lavorano con una diversa base di conoscenze in base al compito specifico: in primo lu- ogo sono stati descritti due approcci supervisionati che hanno evidenziato le peculiarit del rilevamento della caduta audio e hanno dimostrato l’efficacia del sensore proposto. Per via delle poche cadute umane reali a disposizione per lo sviluppo di tali sistemi, sono stati proposti approcci non supervisionati che non necessitano di esempi della classe target nella fase di apprendimento. stato di- mostrato che gli approcci non supervisionati hanno prestazioni migliori rispetto ai sistemi dello stato dell’arte, ma funzionano bene in scenari poco complessi. Infine, sono stati sviluppati e descritti metodi che funzionano in condizioni pi realistiche. Viene proposto un sistema in cui l’utente interviene correggendo il funzionamento del sistema per una notevole riduzione dei falsi allarmi. Poi viene proposto un approccio di apprendimento one-shot che, senza l’intervento dell’utente, pu ottenere risultati promettenti utilizzando solo alcuni esempi di caduta umana nella fase di addestramento. La tesi si conclude con una valu- tazione approfondita di un approccio basato su un Autoencoder siamese. stato dimostrato che questo approccio migliore di tutti i sistemi precedentemente proposti quando valutatti in scenari complessi.
deep learning; fall detection; audio event classification; machine learning
File in questo prodotto:
File Dimensione Formato  
Tesi_Droghini.pdf

accesso aperto

Descrizione: Tesi_Droghini.pdf
Tipologia: Tesi di dottorato
Licenza d'uso: Creative commons
Dimensione 18.56 MB
Formato Adobe PDF
18.56 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11566/263538
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact