Mostrar el registro sencillo del ítem
Clustering aglomerativo para la desambiguación de nombres de autor
dc.contributor.author | Padilla-Mesa, Juan Antonio | |
dc.date | 2021-09 | |
dc.date.accessioned | 2021-12-21T11:58:56Z | |
dc.date.available | 2021-12-21T11:58:56Z | |
dc.identifier.uri | https://reunir.unir.net/handle/123456789/12235 | |
dc.description | Author’s name ambiguity in bibliographic databases entail a big problem to retrieving information, bibliometric analyzes and visibility of science. This is due to the phenomena called documentary noise and silence. The main objective of this work is to compare the proposal based on agglomerative clustering made by Schulz et al. (2014) with an expanded proposal from the original and determine if it offers better results. In order to achieve the objectives, a dataset has been bult that contains 60.663 records from the area of “Information Science & Library Science” from Web of Science to which both proposals have been applied. Analyzing the results on 5 different authors with ambiguous names, it has been observed that, although the extended proposal slightly improves the results, both proposals offer similar results for solving this problem. | es_ES |
dc.description.abstract | La ambigüedad de los nombres de autor en las bases de datos bibliográficas supone un gran problema a la hora de la recuperación de información, la realización de análisis bibliométricos y la visibilidad de la ciencia. Esto se debe a los fenómenos denominados ruido y silencio documental. Algunos autores han propuesto técnicas para paliar este problema. El objetivo principal de este trabajo es comparar la propuesta original basada en clustering aglomerativo realizada por Schulz et al. (2014), con una propuesta ampliada a partir de la original y determinar si esta propuesta ampliada ofrece mejores resultados. Para la consecución de los objetivos se ha diseñado un dataset compuesto por 60.663 registros del área de “Information Science & Library Science” provenientes de Web of Science, sobre el que se han aplicado ambas propuestas. Analizando los resultados sobre 5 autores distintos con nombres ambiguos, se ha observado que, aunque la propuesta ampliada mejore levemente los resultados, ambas propuestas ofrecen similares resultados para la resolución de este problema. | es_ES |
dc.language.iso | spa | es_ES |
dc.rights | openAccess | es_ES |
dc.subject | desambiguación de términos | es_ES |
dc.subject | clustering | es_ES |
dc.subject | recuperación de información | es_ES |
dc.subject | machine learning | es_ES |
dc.subject | web of Science | es_ES |
dc.subject | disambiguation | es_ES |
dc.subject | information retrieval | es_ES |
dc.subject | machine learning | es_ES |
dc.subject | Máster en Visual Analytics y Big Data | es_ES |
dc.title | Clustering aglomerativo para la desambiguación de nombres de autor | es_ES |
dc.type | masterThesis | es_ES |
reunir.tag | ~MAVDM | es_ES |