Mostrar el registro sencillo del ítem

dc.contributor.authorJusto-Sarmentero, Luis Vicente
dc.date2023-11-08
dc.date.accessioned2023-11-29T12:31:06Z
dc.date.available2023-11-29T12:31:06Z
dc.identifier.urihttps://reunir.unir.net/handle/123456789/15653
dc.descriptionAdvances in the development and commercialization of autonomous driving systems have experienced a significant acceleration in recent years. The complexity of these systems, the volume and diversity of data they utilize, and the speed of response they require compel the search for solutions that offer maximal execution speed and minimal computational cost. Within this pursuit, experimentation and comparison of different alternatives for vehicle environment interpretation are crucial in finding the optimal solution. This work focuses on the task of artificial vision for environment interpretation, particularly on semantic image segmentation using U-Net, ResNet, and PsPNet neural networks. The objective of this study is to contribute to finding the optimal solution for semantic segmentation tasks by training a neural network based on the UNet architecture with the A2D2 from Audi AG ® dataset. The performance of this model is then compared with the results obtained by the authors of the aforementioned dataset publication. These authors employed a combination of ResNet and PsPNet neural networks for their architecture. In this project, we first address the current approaches for autonomous driving and how semantic image segmentation fits into them. The main elements for the execution of this task such as sensors, datasets, simulators, ETL tools and artificial intelligence techniques are developed by delving into the different types of neural networks. A complete method is provided using Python and TensorFlow libraries for the extraction, processing and loading of the A2D2 dataset as well as for the construction of the neural network model based on U-Net, its training with this dataset, and its evaluation under the most common metrics in semantic segmentation. Luis Vicente Justo Sarmentero Máster Universitario en Análisis y Visualización de Datos Masivos Comparativa U-Net vs. ResNet + PsPNet para dataset A2D2 4 As a result of this work, along with an in-depth analysis of the A2D2 dataset and extensively commented Python algorithms, the performance of the UNet model is obtained in terms of Dice and IoU indices, as well as training and evaluation times. These results are compared with those published by the authors of the A2D2 dataset from Audi AG® . This comparison leads to the conclusion that the U-Net architecture does not exhibit improved performance compared to the results achieved by the aforementioned authors. However, since the training and evaluation time values have not been published by said authors, a comparison with the results of this work is not feasible. Therefore, these aspects remain available for potential future lines of work. Similarly, future work could involve parameterizinges_ES
dc.description.abstractLos avances en el desarrollo y comercialización de sistemas de conducción autónoma han tenido una fuerte aceleración en los últimos años. La complejidad de estos sistemas, la cantidad y diversidad de datos que utilizan y la velocidad de respuesta que necesitan, obligan a buscar soluciones con la máxima velocidad ejecución y el menor coste computacional posible. Dentro de esta búsqueda, la experimentación y comparación de diferentes alternativas para la interpretación del entorno del vehículo es capital para encontrar la solución óptima. Este trabajo se centra en la tarea de la visión artificial para la interpretación del entorno y particularmente en la segmentación semántica de imágenes mediante la utilización de redes neuronales U-Net, ResNet y PsPNet. El objetivo de este trabajo es contribuir a encontrar la solución más óptima para la tarea de segmentación semántica realizando el entrenamiento, con el dataset A2D2 de Audi AG®, de una red neuronal basada en la arquitectura U-Net y la comparación de su rendimiento con el obtenido por los autores de la publicación del mencionado dataset. Dichos autores, utilizaron una arquitectura compuesta por la combinación de las redes neuronales ResNet y PsPNet. En este proyecto, primero se abordan los enfoques actuales para la conducción autónoma y cómo encaja la segmentación semántica de imágenes en ellos. Se desarrollan los elementos principales para la ejecución de esta tarea como sensores, dataset, simuladores, herramientas ETL y técnicas de inteligencia artificial profundizando en los distintos tipos de redes neuronales. Se proporciona un método completo mediante la utilización de librerías de Python, TensorFlow y Keras para la extracción, tratamiento y carga del dataset A2D2, la construcción del modelo de red neuronal basado en U-Net, su entrenamiento con dicho dataset, y la evaluación del mismo bajo las métricas más comunes en segmentación semántica. Como resultado de este trabajo, además del análisis en profundidad del dataset A2D2 y los algoritmos en Python comentados al detalle, se obtiene el rendimiento del modelo U-Net para los índices Dice e IoU, así como el tiempo de entrenamiento y evaluación. Estos resultados se comparan con los publicados por los autores del dataset A2D2 de Audi AG® . Esta comparación permite concluir que la arquitectura U-Net no presenta una mejora en el rendimiento con respecto a los resultados obtenidos por los mencionados autores. No obstante, dado que los valores de tiempo de entrenamiento y tiempo de valuación no han sido publicados por dichos autores no es posible compararlos con los obtenidos en este trabajo, por lo que quedan disponibles para posibles líneas de trabajo futuras. De igual modo, como futuros trabajos, se propone la parametrización de la red neuronal U-Net de forma diferente para conseguir una mejora del rendimiento.es_ES
dc.language.isospaes_ES
dc.rightsopenAccesses_ES
dc.subjectvisión artificiales_ES
dc.subjectsegmentación semánticaes_ES
dc.subjectredes neuronaleses_ES
dc.subjectU-Netes_ES
dc.subjectPythones_ES
dc.subjectTensorFlowes_ES
dc.subjectKerases_ES
dc.subjectcomputer visiones_ES
dc.subjectsemantic segmentationes_ES
dc.subjectneural networkses_ES
dc.subjectMáster en Visual Analytics y Big Dataes_ES
dc.titleComparativa U-Net vs. ResNet + PsPNet para el dataset A2D2.es_ES
dc.typemasterThesises_ES
reunir.tag~MAVDMes_ES


Ficheros en el ítem

Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem