Pose-based Gesture Recognition in Autonomous Vehicles using Speech Recognition Networks
Autor:
Pardo-Decimavilla, Pablo
Fecha:
10/07/2024Palabra clave:
Tipo de Ítem:
masterThesis
Resumen:
Reconocer distracciones en la carretera es esencial para reducir accidentes de tráfico. Las redes basadas en video suelen usarse, pero tienen un alto costo computacional y son vulnerables a cambios de perspectiva. Este artículo propone un enfoque novedoso para clasificar acciones del conductor basado en poses, utilizando redes de reconocimiento de voz, que son más ligeras y resistentes a los cambios de perspectiva. La similitud en la codificación entre datos de audio y poses se aprovecha representando poses como puntos clave a lo largo del tiempo. Nuestra arquitectura se basa en Squeezeformer (Kim et al., 2022), una red de reconocimiento de voz eficiente y basada en atención. Implementamos técnicas de aumento de datos para mejorar la generalización. Los experimentos con el conjunto de datos Drive&Act muestran un rendimiento superior frente a métodos de última generación. Además, desarrollamos un conjunto de datos real para ajustar el modelo, permitiendo su uso en entornos personalizados. Los resultados destacan la eficacia y robustez de estas redes en la clasificación de acciones basadas en poses.
Descripción:
Recognizing distractions on the road is crucial to reduce traffic accidents. Video-based networks are typically used, but are limited by their computational cost and are vulnerable to viewpoint changes. In this paper, we propose a novel approach for pose-based driver action classification using speech recognition networks, which is lighter and more viewpoint invariant that video-based one. We leverage the similarity in the encoding of information between audio and pose data, representing poses as key points over time. Our architecture is based on Squeezeformer (Kim et al., 2022), an efficient attention-based speech recognition network. We introduce a selection of data augmentation techniques to enhance generalization. Experiments on the Drive&Act dataset demonstrate superior performance compared to state-of-the-art methods. Additionally, we have developed a real dataset to finetune the model, enabling deployment in a custom environments. Our results highlight the effectiveness and robustness of speech recognition networks in pose-based action classification.
Ficheros en el ítem
Este ítem aparece en la(s) siguiente(s) colección(es)
Estadísticas de uso
| Año |
| 2012 |
| 2013 |
| 2014 |
| 2015 |
| 2016 |
| 2017 |
| 2018 |
| 2019 |
| 2020 |
| 2021 |
| 2022 |
| 2023 |
| 2024 |
| 2025 |
| Vistas |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 13 |
| Descargas |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 10 |
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Prevalence, characteristics, and impact of adverse events in 34 Madrid hospitals. The ESHMAD study
Valencia-Martín, José Lorenzo; Vicente-Guijarro, Jorge; San José Saras, Diego; Moreno-Nuñez, Paloma; Pardo, Alberto; Aranaz Andrés, Jesús María; ...et al.; Pardo Ortiz, María (European Journal of Clinical Investigation, 2022)Introduction: Adverse Events (AE) are one of the main problems in healthcare. Therefore, many policies have been developed worldwide to mitigate their impact. The Patient Safety Incident Study in Hospitals in the Community ... -
Aplicación del método Binding en 1º de Primaria
Campos-Pardo, Mercedes (29/01/2016)El presente trabajo profundiza en el Método Binding y diseña un proyecto educativo para aplicarlo este método en un aula de 1º de Primaria. Binding es un método innovador, apoyado en una base científica, para aprender a ... -
Enseñar y aprender de las emociones en Educación Infantil
Pardo-García, Marina Rosalía (13/02/2015)El desarrollo del ser humano es un proceso complejo. En él cohabitan diferentes factores: desde el desarrollo puramente físico al intelectual, pasando inevitablemente por el desarrollo emocional. Éste último fue relegado ...





