Comparativa U-Net vs. ResNet + PsPNet para el dataset A2D2.

Justo-Sarmentero, Luis Vicente

Archivos

Citación

Citar documentos

Compartir

Gestor bibliográfico

Métricas e impacto

Indexadores

Resumen

Los avances en el desarrollo y comercialización de sistemas de conducción autónoma han tenido una fuerte aceleración en los últimos años. La complejidad de estos sistemas, la cantidad y diversidad de datos que utilizan y la velocidad de respuesta que necesitan, obligan a buscar soluciones con la máxima velocidad ejecución y el menor coste computacional posible. Dentro de esta búsqueda, la experimentación y comparación de diferentes alternativas para la interpretación del entorno del vehículo es capital para encontrar la solución óptima. Este trabajo se centra en la tarea de la visión artificial para la interpretación del entorno y particularmente en la segmentación semántica de imágenes mediante la utilización de redes neuronales U-Net, ResNet y PsPNet. El objetivo de este trabajo es contribuir a encontrar la solución más óptima para la tarea de segmentación semántica realizando el entrenamiento, con el dataset A2D2 de Audi AG®, de una red neuronal basada en la arquitectura U-Net y la comparación de su rendimiento con el obtenido por los autores de la publicación del mencionado dataset. Dichos autores, utilizaron una arquitectura compuesta por la combinación de las redes neuronales ResNet y PsPNet. En este proyecto, primero se abordan los enfoques actuales para la conducción autónoma y cómo encaja la segmentación semántica de imágenes en ellos. Se desarrollan los elementos principales para la ejecución de esta tarea como sensores, dataset, simuladores, herramientas ETL y técnicas de inteligencia artificial profundizando en los distintos tipos de redes neuronales. Se proporciona un método completo mediante la utilización de librerías de Python, TensorFlow y Keras para la extracción, tratamiento y carga del dataset A2D2, la construcción del modelo de red neuronal basado en U-Net, su entrenamiento con dicho dataset, y la evaluación del mismo bajo las métricas más comunes en segmentación semántica. Como resultado de este trabajo, además del análisis en profundidad del dataset A2D2 y los algoritmos en Python comentados al detalle, se obtiene el rendimiento del modelo U-Net para los índices Dice e IoU, así como el tiempo de entrenamiento y evaluación. Estos resultados se comparan con los publicados por los autores del dataset A2D2 de Audi AG® . Esta comparación permite concluir que la arquitectura U-Net no presenta una mejora en el rendimiento con respecto a los resultados obtenidos por los mencionados autores. No obstante, dado que los valores de tiempo de entrenamiento y tiempo de valuación no han sido publicados por dichos autores no es posible compararlos con los obtenidos en este trabajo, por lo que quedan disponibles para posibles líneas de trabajo futuras. De igual modo, como futuros trabajos, se propone la parametrización de la red neuronal U-Net de forma diferente para conseguir una mejora del rendimiento.

Colecciones

Área de Ingeniería y Tecnología

Cargando...

Página completa del ítem