Comparativa de técnicas de aprendizaje no supervisado para la identificación y caracterización de subpoblaciones de diabetes mellitus tipo II
Autor:
Hernández-Pineda, Giorgio Enrique
Fecha:
01/02/2024Palabra clave:
Tipo de Ítem:
masterThesisResumen:
En el presente estudio, se propone la evaluación de tres técnicas de aprendizaje no supervisado en un conjunto de datos de diabetes mellitus, que recopila datos de aproximadamente 100.000 pacientes en más de 130 hospitales en Estados Unidos, con el objetivo de
identificar y caracterizar distintas sub-poblaciones. La metodología implementada fue una versión de CRISP-DM acondicionada a los problemas de clasificación no supervisada. Fueron evaluados algoritmos con principios de funcionamiento diferentes, siendo el K-Means, DBSCAN, y agrupamiento jerárquico los seleccionados. Para evaluarlos, se seleccionaron 3 índices diferentes, sin embargo, el análisis de sub-poblaciones resultantes fue el más determinante en la evaluación. Finalmente, el agrupamiento jerárquico es una excelente opción, siempre y cuando la capacidad de cómputo permita utilizarle. Seguido, los algoritmos como K-Means Y DBSCAN requieren de representaciones adecuadas, siendo UMAP la preferida en cuanto a conjuntos de datos con alta cantidad de variables epidemiológicas y gran cantidad de datos.
Descripción:
This study offers an assessment of unsupervised techniques on a diabetes mellitus dataset which comprises data on about 100.000 patients and 130 hospitals in the United
States. The objective of this research is to identify sub-populations within the data. The
methodology used is a CRISP-DM-adapted version for non-supervised algorithms. Three
algorithms with different principles were evaluated: K-Means, DBSCAN, and hierarchical
clustering. Three different metrics were used for evaluation; however, sub-population-based
analysis was found to be the most pertinent. Additionally, when the processing capacity
permits it, hierarchical clustering is an excellent option. Finally, K-Means and DBSCAN
algorithms require proper representations of the data, making UMAP the most recommended for datasets including a significant number of epidemiological variables.
Ficheros en el ítem
Nombre: diabetes_mellitus_unsupervised_merged.pdf
Tamaño: 3.643Mb
Formato: application/pdf
Este ítem aparece en la(s) siguiente(s) colección(es)
Estadísticas de uso
Año |
2012 |
2013 |
2014 |
2015 |
2016 |
2017 |
2018 |
2019 |
2020 |
2021 |
2022 |
2023 |
2024 |
Vistas |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
449 |
Descargas |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
392 |
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Social Voting Techniques: A Comparison of the Methods Used for Explicit Feedback in Recommendation Systems
Nuñez-Valdez, Edward Rolando; Cueva-Lovelle, Juan Manuel; Sanjuan, Oscar; Montenegro-Marin, Carlos Enrique; Infante Hernandez, Guillermo (International Journal of Interactive Multimedia and Artificial Intelligence (IJIMAI), 12/2011)Web recommendation systems usually brings a content list to users based on previous ratings made by them to other similar contents through some social voting mean. This paper aims to present a comparison of the main ... -
Comparison of two methods to estimate adverse events in the IBEAS Study (Ibero-American study of adverse events): cross-sectional versus retrospective cohort design
Aranaz Andrés, Jesús María ; Aibar Remón, Carlos; Gea-Velázquez de Castro, María Teresa; Limón Ramírez, Ramón; Bolúmar, Francisco; Hernández-Aguado, Ildefonso; López Fresneña, Nieves ; Díaz-Agero Pérez, Cristina ; Terol García, Enrique; Michel, Philippe; Sousa, Paulo; Larizgoitia Jauregui, Itziar (BMJ Open, 2017)Background Adverse events (AEs) epidemiology is the first step to improve practice in the healthcare system. Usually, the preferred method used to estimate the magnitude of the problem is the retrospective cohort study ... -
Algorithm and software based on MLPNN for estimating channel use in the spectral decision stage in cognitive radio networks
Hernández Viveros, Johana ; López Sarmiento, Danilo; Vera, Nelson Enrique (ARPN Journal of Engineering and Applied Sciences, 01/03/2018)The use of the multilayer perceptron neural networks (MLPNN) technique is proposed to estimate the future state of use of a licensed channel by primary users (PUs); this will be useful at the spectral decision stage in ...