Cargando...

Archivos

Citación

Citar documentos

Compartir

Gestor bibliográfico

Mendeley

Métricas e impacto

Indexadores

OpenAIRERecolecta

Resumen

En este proyecto de investigación se muestra el desarrollo de un modelo supervisado de machine learning a partir de los datos de los catálogos Gaia DR3, Kepler y TESS de curvas de luz de estrellas intrínsecamente variables, con el objetivo de identificar eventos de tránsito de exoplanetas ocultos en la variabilidad intrínseca de este tipo de estrellas. Se ha trabajado con los modelos clasificadores XGBoost y Random Forest, sobre los cuales se ha evaluado su desempeño usando conjuntos de datos de las curvas de luz disponibles del catálogo Kepler. Como parte del desarrollo de estos modelos, se han realizado técnicas de preprocesamiento de datos para reducir el ruido en las señales y la variabilidad del flujo de cada curva de luz, así como un análisis de sus componentes principales. Adicionalmente, se ha evaluado cada modelo mediante la optimización de hiperparámetros y ejecución de procesos iterativos para maximizar las métricas principales de desempeño. Los resultados para los modelos muestran que para el conjunto de validación se ha obtenido un F1-score en la clase positiva (Tránsito) de 0.83 y un accuracy de 0.81 en XGBoost. Respecto a Random Forest, se ha obtenido un F1-score de 0.82 en la misma clase y un accuracy de 0.82. El modelo con mejores resultados para el conjunto de prueba ha sido XGBoost con un F1-score de 0.79 y un accuracy de 0.80 (sección 5.2.1). Por su parte, con Random Forest hemos obtenido un F1-score de 0.78 y un accuracy de 0.80 (sección 5.2.2). A partir de estos resultados, se han ejecutado los mejores modelos de XGBoost y Random Forest con una nueva muestra de 1792 curvas de luz que no han sido clasificadas como objetos de interés en la misión Kepler para evaluar la capacidad de generalización de ambos modelos. Se ha obtenido una predicción de Tránsito de 11.16% y No Tránsito de 88,84% para XGBoost versus una predicción de Tránsito de 15,12% y No Tránsito de 84,88% en Random Forest. Finalmente, se plantean los siguientes pasos, así como estrategias adicionales que sirvan como punto de partida para trabajos futuros.

Colecciones


Página completa del ítem