Assessing the Performances of different Neural Network Architectures for the Detection of Screams and Shouts in Public Transportation - Ifsttar Accéder directement au contenu
Article Dans Une Revue Expert Systems with Applications Année : 2019

Assessing the Performances of different Neural Network Architectures for the Detection of Screams and Shouts in Public Transportation

Résumé

As intelligent transportation systems are becoming more and more prevalent, the relevance of automatic surveillance systems grows larger. While such systems rely heavily on video signals, other types of signals can be used as well to monitor the security of passengers. The present article proposes an audio-based intelligent system for surveillance in public transportation, investigating the use of some state-of-the-art artificial intelligence methods for the automatic detection of screams and shouts. We present test results produced on a database of sounds occurring in subway trains in real working conditions, by classifying sounds into screams, shouts and other categories using different Neural Network architectures. The relevance of these architectures in the analysis of audio signals is analyzed. We report encouraging results, given the difficulty of the task, especially when a high level of surrounding noise is present.
Au jour où les systèmes de transport intelligents devenant de plus en plus répandus, l'intérêt des systèmes de surveillance automatique augmente. Bien que ces systèmes reposent principalement sur les signaux vidéo, d'autres types de signaux peuvent également être utilisés pour surveiller la sécurité des passagers. Le présent article propose un système automatique de reconnaissance de motifs sonores pour la surveillance à l'intérieur des transports publics, en étudiant l'utilisation de méthodes d'intelligence artificielle de pointe pour la détection automatique des cris. Nous présentons des résultats testés sur une base de données de sons enregistrés au sein même d'une rame de métro dans des conditions de travail réelles, en classant les sons en cris et en d'autres catégories en utilisant différentes architectures de réseaux de neurones. Les résultats obtenus sont encourageants, compte tenu de la difficulté de la tâche, en particulier lorsque le niveau de bruit environnant est élevé.
Fichier principal
Vignette du fichier
doc00029592.pdf (3.08 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01892436 , version 1 (10-10-2018)

Identifiants

Citer

Pierre Laffitte, Yun Wang, David Sodoyer, Laurent Girin. Assessing the Performances of different Neural Network Architectures for the Detection of Screams and Shouts in Public Transportation. Expert Systems with Applications, 2019, 117, pp.29-41. ⟨10.1016/j.eswa.2018.08.052⟩. ⟨hal-01892436⟩
169 Consultations
243 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More