• Mi Re-Unir
    Búsqueda Avanzada
    JavaScript is disabled for your browser. Some features of this site may not work without it.
    Ver ítem 
    •   Inicio
    • TRABAJOS FIN DE MÁSTER
    • Área de Ingeniería y Tecnología
    • Ver ítem
    •   Inicio
    • TRABAJOS FIN DE MÁSTER
    • Área de Ingeniería y Tecnología
    • Ver ítem

    Pose-based Gesture Recognition in Autonomous Vehicles using Speech Recognition Networks

    Autor: 
    Pardo-Decimavilla, Pablo
    Fecha: 
    10/07/2024
    Palabra clave: 
    conducción autónoma; sistemas avanzados de advertencia de distracción del conductor; aprendizaje profundo; Transformers; autonomous driving; advanced driver distraction warning systems; deep learning; Máster en Inteligencia Artificial
    Tipo de Ítem: 
    masterThesis
    URI: 
    https://reunir.unir.net/handle/123456789/18414
    Open Access
    Resumen:
    Reconocer distracciones en la carretera es esencial para reducir accidentes de tráfico. Las redes basadas en video suelen usarse, pero tienen un alto costo computacional y son vulnerables a cambios de perspectiva. Este artículo propone un enfoque novedoso para clasificar acciones del conductor basado en poses, utilizando redes de reconocimiento de voz, que son más ligeras y resistentes a los cambios de perspectiva. La similitud en la codificación entre datos de audio y poses se aprovecha representando poses como puntos clave a lo largo del tiempo. Nuestra arquitectura se basa en Squeezeformer (Kim et al., 2022), una red de reconocimiento de voz eficiente y basada en atención. Implementamos técnicas de aumento de datos para mejorar la generalización. Los experimentos con el conjunto de datos Drive&Act muestran un rendimiento superior frente a métodos de última generación. Además, desarrollamos un conjunto de datos real para ajustar el modelo, permitiendo su uso en entornos personalizados. Los resultados destacan la eficacia y robustez de estas redes en la clasificación de acciones basadas en poses.
    Descripción: 
    Recognizing distractions on the road is crucial to reduce traffic accidents. Video-based networks are typically used, but are limited by their computational cost and are vulnerable to viewpoint changes. In this paper, we propose a novel approach for pose-based driver action classification using speech recognition networks, which is lighter and more viewpoint invariant that video-based one. We leverage the similarity in the encoding of information between audio and pose data, representing poses as key points over time. Our architecture is based on Squeezeformer (Kim et al., 2022), an efficient attention-based speech recognition network. We introduce a selection of data augmentation techniques to enhance generalization. Experiments on the Drive&Act dataset demonstrate superior performance compared to state-of-the-art methods. Additionally, we have developed a real dataset to finetune the model, enabling deployment in a custom environments. Our results highlight the effectiveness and robustness of speech recognition networks in pose-based action classification.
    Mostrar el registro completo del ítem
    Ficheros en el ítem
    icon
    Nombre: Pardo Decimavilla, Pablo.pdf
    Tamaño: 6.077Mb
    Formato: application/pdf
    Ver/Abrir
    Este ítem aparece en la(s) siguiente(s) colección(es)
    • Área de Ingeniería y Tecnología

    Estadísticas de uso

    Año
    2012
    2013
    2014
    2015
    2016
    2017
    2018
    2019
    2020
    2021
    2022
    2023
    2024
    2025
    Vistas
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    13
    Descargas
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    0
    10

    Ítems relacionados

    Mostrando ítems relacionados por Título, autor o materia.

    • Prevalence, characteristics, and impact of adverse events in 34 Madrid hospitals. The ESHMAD study 

      Valencia-Martín, José Lorenzo; Vicente-Guijarro, Jorge; San José Saras, Diego; Moreno-Nuñez, Paloma; Pardo, Alberto; Aranaz Andrés, Jesús María; ...et al.; Pardo Ortiz, María (European Journal of Clinical Investigation, 2022)
      Introduction: Adverse Events (AE) are one of the main problems in healthcare. Therefore, many policies have been developed worldwide to mitigate their impact. The Patient Safety Incident Study in Hospitals in the Community ...
    • Aplicación del método Binding en 1º de Primaria 

      Campos-Pardo, Mercedes (29/01/2016)
      El presente trabajo profundiza en el Método Binding y diseña un proyecto educativo para aplicarlo este método en un aula de 1º de Primaria. Binding es un método innovador, apoyado en una base científica, para aprender a ...
    • Enseñar y aprender de las emociones en Educación Infantil 

      Pardo-García, Marina Rosalía (13/02/2015)
      El desarrollo del ser humano es un proceso complejo. En él cohabitan diferentes factores: desde el desarrollo puramente físico al intelectual, pasando inevitablemente por el desarrollo emocional. Éste último fue relegado ...

    Mi cuenta

    AccederRegistrar

    ¿necesitas ayuda?

    Manual de UsuarioContacto: reunir@unir.net

    Listar

    todo Re-UnirComunidades y coleccionesPor fecha de publicaciónAutoresTítulosPalabras claveTipo documentoTipo de accesoEsta colecciónPor fecha de publicaciónAutoresTítulosPalabras claveTipo documentoTipo de acceso






    Aviso Legal Política de Privacidad Política de Cookies Cláusulas legales RGPD
    © UNIR - Universidad Internacional de La Rioja
     
    Aviso Legal Política de Privacidad Política de Cookies Cláusulas legales RGPD
    © UNIR - Universidad Internacional de La Rioja