Análisis y optimización de algoritmos de clasificación supervisada sobre operaciones impagadas en tarjetas de crédito
Autor:
de Juan-de Llano, Iozu
Fecha:
21/09/2017Palabra clave:
Tipo de Ítem:
masterThesisResumen:
El presente proyecto tiene como objetivo identificar el algoritmo con mayor exactitud, para detectar patrones de impago en tarjetas de crédito partiendo a partir de un dataset con operaciones anónimas reales. Para poder identificar patrones de impago se han utilizado veinticuatro algoritmos de inteligencia artificial basados en clasificación supervisada, así como técnicas de clustering, eliminación de valores fuera de rango, normalización de variables, tratamiento de valores ausentes, selección de variables o tratamiento de datasets no balanceados, entre otras técnicas, con el fin de intentar mejorar el nivel de exactitud inicial. A partir de los resultados iniciales, en los que se evalúan los algoritmos principalmente en base a su nivel de exactitud, se han identificado los algoritmos con mejores resultados para analizar adicionalmente su precisión, sensibilidad, área ROC, tiempo de ejecución, número de variables utilizadas, su rendimiento y complejidad en cuanto al modelo generado y la interpretación de los resultados obtenidos, identificando el algoritmo que mejor clasifica las instancias, comparando, además, los resultados obtenidos con estudios previos realizados sobre el mismo dataset, así como sobre estudios similares realizados sobre otros datasets con información de tarjetas de crédito. Concretamente, en el estudio previo existente el algoritmo seleccionado es la red neuronal. En el presente trabajo se concluye que la combinación de selección de atributos junto con el algoritmo de clasificación J48 proporcionan niveles similares de exactitud, precisión y sensibilidad, si bien reducen sensiblemente el tiempo de ejecución (es 60 veces más rápido que la red neuronal) así como mejoran la facilidad de interpretación de los resultados (utiliza sólo 6 de 23 atributos distribuidos en un árbol de 25 nodos con 24 conexiones, frente a la red neuronal que utiliza 23 de 23 atributos y 37 nodos con 338 conexiones).
Descripción:
The present project has as aim to identify the algorithm with better accuracy values in the detection of default in credit card real operations from an anonymous dataset. In order to identify patterns of default, there have been tested twenty four artificial intelligence algorithms based on supervised classification, as well as technics like clustering, outliers elimination, variable normalization, absent values treatment, feature selection, or data balancing dataset techniques. These have been applied trying to improve the level of the initial accuracy. Starting from initial results on the basis of the accuracy level, the methods with higher accuracy have been chosen to conduct an analysis on additional parameters such as precision, sensitivity, area ROC, running time, number of used variables, complexity regarding the generated model, and about the interpretation of the obtained results. The objective is to identify the algorithm that better classifies the instances, and compare it with the results obtained with the previous studies performed on the same date set, as well as compare it with similar studies carried out on other datasets with credit card information. Specifically, in the previous existing study the selected algorithm was the neuronal network. However, the combination of selection of attributes together with the J48 classification algorithm provide similar accuracy, precision and sensibility levels, as well as much better execution times (it is 60 times faster than neuronal networks) and a better improvement in results interpretation (J48 uses only 6 out of 23 attributes distributed in a tree of 25 nodes with 24 connections opposite to the neuronal network that uses 23 out of 23 attributes and 37 nodes with 338 connections).
Ficheros en el ítem
Este ítem aparece en la(s) siguiente(s) colección(es)
Estadísticas de uso
Año |
2012 |
2013 |
2014 |
2015 |
2016 |
2017 |
2018 |
2019 |
2020 |
2021 |
2022 |
2023 |
2024 |
Vistas |
0 |
0 |
0 |
0 |
0 |
0 |
346 |
426 |
504 |
477 |
682 |
304 |
298 |
Descargas |
0 |
0 |
0 |
0 |
0 |
0 |
704 |
880 |
864 |
672 |
437 |
245 |
207 |
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Periodismo cultural y comunidad política. ¿De verdad deseamos saber?
Llano, Rafael (Nueva Revista, 10/2016)Hacer asequible la cultura al ciudadano es una misión que exige tener muy en cuenta las posibilidades de recepción. Rafael Llano reflexiona sobre estos temas, señalando que el crítico no solamente ha de prestar atención a ... -
Amenazas para la libertad religiosa en el siglo XXI
Hermida del Llano, Cristina (Nueva Revista, 11/2011)A la hora de preguntarse por el contenido de la libertad religiosa, convendría comenzar recordando la diferencia existente entre el foro interno y el foro externo. Ya en la transición entre los siglos XVII y XVIII, Thomasius ... -
Pensar el pensamiento del profesorado
Jiménez Llanos, Ana Beatriz; Feliciano-García, Luis (Revista Española de Pedagogía, 31/01/2006)En este artículo revisamos, desde el momento en que surge este ámbito de investigación hasta la actualidad, los múltiples términos que se utilizan para referirse al pensamiento del profesor. Analizamos sus fundamentos ...