Resumen
En el presente trabajo fin de máster se compara distintas técnicas de la ciencia de datos, machine learning y deep learning con el objetivo de predecir si un individuo padece diabetes mellitus tipo 2, a partir de características antropomórficas y socioculturales, sin tener en cuenta datos clínicos, normalmente con un coste alto por individuo, reduciéndose con ello los costes sanitarios y pudiendo aplicarse en ámbitos sociales con difícil acceso al sistema de salud, como pudiera ser zonas rurales o regiones del tercer mundo. Basado en metodologías de machine learning, se ha determinado el mejor modelo posible capaz de predecir la enfermedad objeto de este trabajo. Para ello se han obtenido diez conjuntos de datos, dos de ellos utilizados de forma intensiva, a partir de encuestas masivas realizadas en Estados Unidos por los “Centros de Control de Prevención de Enfermedades”. Después se realiza un estudio estadístico, determinando los atributos más relevantes, seleccionando las técnicas de balanceo e hiperparámetros óptimos para los distintos algoritmos de aprendizaje supervisado, consiguiendo los mejores modelos; procediendo a la selección, basado en métricas objetivas, del que mejor cumple los objetivos. Además, se han incluido en la comparativa un modelo basado en redes neuronales artificiales densas y otro basado en el ensamblaje de los mejores algoritmos. Se demostrará en este trabajo, en el que se obtendrán modelos basados en machine learning y deep learning con capacidades de predicción superior al 80%, hacen viable un triage temprano de la enfermedad, sin usar parámetros clínicos. Por todo ello, este trabajo podría ser disruptivo en el ámbito sanitario, ahorrando tiempo y costes. Pudiéndose aplicar de forma práctica cómo primer triage en la detección de la enfermedad, además de servir de guía metodológica en proyectos de la misma índole.
Colecciones
Página completa del ítem
.png)
