Resumen
El presente proyecto tiene como objetivo identificar el algoritmo con mayor exactitud usando una comparativa de técnicas de Machine Learning para detectar el comportamiento de pago de clientes con cuentas por cobrar con la finalidad de ayudar a la gestión de cobranzas, en una base a una correcta predicción a focalizar sus recursos y esfuerzos en clientes con mayor riesgo de mora y reducir a las acciones de intervención en clientes que si pagarán la próxima cuota mensual del crédito. La metodología utilizada está basada en KDD que parte de obtener el conocimiento de dominio en el área de cobranzas, un análisis exploratorio con técnicas de visualización para identificar el conjunto de datos objetivo totalmente anonimizado, siguiendo con la fase de preparación y pre procesamiento de datos que incluye; limpieza de datos, creación de campos calculados, transformación de variables categóricas en numéricas, selección de atributos entre otros, para aplicar minería de datos que permita encontrar patrones de información y el mejor modelo de predicción. Usando varios algoritmos de clasificación y métricas de evaluación se determina que los algoritmos J48 y Random Forest presentan mejores y semejantes resultados en rendimiento, precisión y exactitud con la técnica de selección de atributos ha sido de gran importancia en la generación del modelo, lo cual ha repercutido en la calidad de desempeño del modelo final, la importancia de usar técnicas de visualización en el análisis exploratorio de los datos y la evaluación de métricas de desempeño ha sido fundamental en la toma de decisiones.
Colecciones
Página completa del ítem
.png)
