Resumen
La clasificación de imágenes ha sido una de las principales áreas de investigación dentro del campo de visión artificial. Desde hace algo más de una década ha estado dominado por las redes neuronales convolucionales, CNN, que a pesar de los buenos resultados y grandes éxitos que han cosechado, sufren de varios inconvenientes. Para solventar estos problemas, recientemente se ha desarrollado un nuevo algoritmo de redes neuronales llamado redes de cápsulas (CapsNet) basado en vectores y en un nuevo algoritmo de entrenamiento llamado algoritmo de enrutamiento dinámico, de manera que podría mejorar los resultados de conocidas arquitecturas para la clasificación de imágenes como lo son las redes neuronales convolucionales. En este estudio se ha probado el rendimiento de esta nueva arquitectura, y se ha comparado con una arquitectura convolucional basada en bloques residuales. Para contrastar los resultados se han usado conjuntos de datos de distintas complejidades (MNIST, Fashion-MNIST, COIL-100 y CIFAR-10). A pesar de la buena perspectiva teórica que ofrece este nuevo modelo en la teoría, los resultados obtenidos todavía no son lo esperados en cuanto se manejan conjuntos de datos con cierta complejidad. Con MNIST y muy cerca, Fashion-MNIST sí se han mejorado los resultados, mientras que con los conjuntos de datos más complejos (COIL-100 Y CIFAR-10), los resultados no han sido los esperado.
Colecciones
Página completa del ítem
.png)
