Cargando...

Archivos

Citación

Citar documentos

Compartir

Gestor bibliográfico

Mendeley

Métricas e impacto

Indexadores

OpenAIRERecolecta

Resumen

En el presente estudio, se propone la evaluación de tres técnicas de aprendizaje no supervisado en un conjunto de datos de diabetes mellitus, que recopila datos de aproximadamente 100.000 pacientes en más de 130 hospitales en Estados Unidos, con el objetivo de identificar y caracterizar distintas sub-poblaciones. La metodología implementada fue una versión de CRISP-DM acondicionada a los problemas de clasificación no supervisada. Fueron evaluados algoritmos con principios de funcionamiento diferentes, siendo el K-Means, DBSCAN, y agrupamiento jerárquico los seleccionados. Para evaluarlos, se seleccionaron 3 índices diferentes, sin embargo, el análisis de sub-poblaciones resultantes fue el más determinante en la evaluación. Finalmente, el agrupamiento jerárquico es una excelente opción, siempre y cuando la capacidad de cómputo permita utilizarle. Seguido, los algoritmos como K-Means Y DBSCAN requieren de representaciones adecuadas, siendo UMAP la preferida en cuanto a conjuntos de datos con alta cantidad de variables epidemiológicas y gran cantidad de datos.

Colecciones

Página completa del ítem