Modelo de identificación de tránsitos en curvas de luz de estrellas intrínsecamente variables
Autor:
Argilés-Gil, Alberto
; Cepeda-Rubio, Fabio Augusto
Fecha:
17/07/2024Palabra clave:
Tipo de Ítem:
masterThesis
Resumen:
En este proyecto de investigación se muestra el desarrollo de un modelo supervisado de machine learning a partir de los datos de los catálogos Gaia DR3, Kepler y TESS de curvas de luz de estrellas intrínsecamente variables, con el objetivo de identificar eventos de tránsito de exoplanetas ocultos en la variabilidad intrínseca de este tipo de estrellas.
Se ha trabajado con los modelos clasificadores XGBoost y Random Forest, sobre los cuales se ha evaluado su desempeño usando conjuntos de datos de las curvas de luz disponibles del catálogo Kepler. Como parte del desarrollo de estos modelos, se han realizado técnicas de preprocesamiento de datos para reducir el ruido en las señales y la variabilidad del flujo de cada curva de luz, así como un análisis de sus componentes principales. Adicionalmente, se ha evaluado cada modelo mediante la optimización de hiperparámetros y ejecución de procesos iterativos para maximizar las métricas principales de desempeño.
Los resultados para los modelos muestran que para el conjunto de validación se ha obtenido un F1-score en la clase positiva (Tránsito) de 0.83 y un accuracy de 0.81 en XGBoost. Respecto a Random Forest, se ha obtenido un F1-score de 0.82 en la misma clase y un accuracy de 0.82.
El modelo con mejores resultados para el conjunto de prueba ha sido XGBoost con un F1-score de 0.79 y un accuracy de 0.80 (sección 5.2.1). Por su parte, con Random Forest hemos obtenido un F1-score de 0.78 y un accuracy de 0.80 (sección 5.2.2).
A partir de estos resultados, se han ejecutado los mejores modelos de XGBoost y Random Forest con una nueva muestra de 1792 curvas de luz que no han sido clasificadas como objetos de interés en la misión Kepler para evaluar la capacidad de generalización de ambos modelos. Se ha obtenido una predicción de Tránsito de 11.16% y No Tránsito de 88,84% para XGBoost versus una predicción de Tránsito de 15,12% y No Tránsito de 84,88% en Random Forest.
Finalmente, se plantean los siguientes pasos, así como estrategias adicionales que sirvan como punto de partida para trabajos futuros.
Descripción:
In this research project, the development of a supervised machine learning model is presented, based on the data from the Gaia DR3, Kepler, and TESS catalogs of light curves of intrinsically variable stars. The objective is to identify exoplanet transit events hidden within the intrinsic variability of these types of stars.
The classifiers XGBoost and Random Forest have been used, and their performance has been evaluated using datasets from the available light curves in the Kepler catalog. As part of the development of these models, data preprocessing techniques have been applied to reduce noise in the signals and the variability of the flux of each light curve, as well as a principal component analysis. Additionally, each model has been evaluated through hyperparameter optimization and iterative processes to maximize the main performance metrics.
The results for the models show that for the validation set, an F1-score of 0.83 in the positive class (Transit) and an accuracy of 0.81 were obtained with XGBoost. For Random Forest, an F1-score of 0.82 in the same class and an accuracy of 0.82 were obtained.
The model with the best results for the test set was XGBoost, with an F1-score of 0.79 and an accuracy of 0.80 (section 5.2.1). On the other hand, Random Forest achieved an F1-score of 0.78 and an accuracy of 0.80 (section 5.2.2).
Based on these results, the best XGBoost and Random Forest models were run on a new sample of 1792 light curves that had not been classified as objects of interest in the Kepler mission to evaluate the generalization capability of both models. A prediction of 11.16% Transit and 88.84% No Transit was obtained with XGBoost, compared to a prediction of 15.12% Transit and 84.88% No Transit with Random Forest.
Finally, the following steps are proposed, along with additional strategies that can serve as a starting point for future work.
Ficheros en el ítem
Nombre: Argilés Gil, Alberto; Cepeda Rubio, Fabio Augusto.pdf
Tamaño: 3.035Mb
Formato: application/pdf
Este ítem aparece en la(s) siguiente(s) colección(es)
Estadísticas de uso
| Año |
| 2012 |
| 2013 |
| 2014 |
| 2015 |
| 2016 |
| 2017 |
| 2018 |
| 2019 |
| 2020 |
| 2021 |
| 2022 |
| 2023 |
| 2024 |
| 2025 |
| Vistas |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 68 |
| Descargas |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 0 |
| 30 |
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Openness in Education as a Praxis: From Individual Testimonials to Collective Voices
Bozkurt, Aras; Gjelsvik, Torunn; Adam, Taskeen; Asino, Tutaleni I.; Atenas, Javiera; Bali, Maha; Blomgren, Constance; Bond, Melissa; Bonk, Curtis J.; Brown, Mark; Burgos, Daniel; Conrad, Dianne; Costello, Eamon; Cronin, Catherine; Czerniewicz, Laura; Deepwell, Maren; Deimann, Markus; DeWaard, Helen J.; Dousay, Tonia A.; Ebner, Martin; Farrow, Robert; Gil-Jaurena, Inés; Havemann, Leo; Inamorato, Andreia; Irvine, Valerie; Karunanayaka, Shironica P.; Kerres, Michael; Lambert, Sarah; Lee, Kyungmee; Makoe, Mpine; Marín, Victoria I.; Mikroyannidis, Alexander; Mishra, Sanjaya; Naidu, Som; Nascimbeni, Fabio; Nichols, Mark; Don Jr., Olcott; Ossiannilsson, Ebba; Otto, Daniel; Padilla Rodriguez, Brenda Cecilia; Paskevicius, Michael; Roberts, Verena; Saleem, Tooba; Schuwer, Robert; Sharma, Ramesh C.; Stewart, Bonnie; Stracke, Christian M.; Tait, Alan; Tlili, Ahmed; Ubachs, George; Weidlich, Joshua; Weller, Martin; Xiao, Junhong; Zawacki-Richter, Olaf (Open Praxis, 2023)Why is Openness in Education important, and why is it critically needed at this moment? As manifested in our guiding question, the significance of Openness in Education and its immediate necessity form the heart of this ... -
La gamificación en el proceso de aprendizaje del vocabulario en inglés
García Cuello, Vionis Patricia; Alfonso Corredor, Raza Yeet; Chaparro Aranguren, Ricardo Luciano; Sánchez Martelo, Carlos Augusto; Briceño Vanegas, Jorge Alberto (Springer Link, 2024)La presente investigación se refiere al proyecto de investigación “Gamificación en el proceso de aprendizaje de vocabulario en inglés”, el cual tiene como objetivo analizar las incidencias del uso de técnicas de gamificación ... -
Translational algorithms for technological dietary quality assessment integrating nutrimetabolic data with machine learning methods
de la O, Victor; Fernández-Cruz, Edwin; Matía Matín, Pilar; Larrad-Sainz, Angélica; Espadas Gil, Jose Luis; Barabash, Ana; Fernández-Díaz, Cristina M.; Calle-Pascual, Alfonso L.; Rubio-Herrera, Miguel A.; Martínez, J. Alfredo (MDPI, 2024)Recent advances in machine learning technologies and omics methodologies are revolutionizing dietary assessment by integrating phenotypical, clinical, and metabolic biomarkers, which are crucial for personalized precision ...





