Evaluación del algoritmo de desambiguación de autores de AMiner en un metabuscador académico de Ciencias de la Computación
Resumen
La desambiguación de autores es un problema de gran relevancia para los sistemas de recuperación de información del ámbito académico. El algoritmo de desambiguación de nombres de AMiner representa uno de los enfoques basados en Aprendizaje Automático con mayor impacto en la actualidad. En este trabajo, se presenta una evaluación del algoritmo de desambiguación de nombres de AMiner para la desambiguación de autores en el contexto de un metabuscador académico del área de las Ciencias de la Computación. Los resultados experimentales con datos generados por el metabuscador académico dan cuenta de un desempeño promedio similar a la referencia. Asimismo, las evaluaciones experimentales permitieron identificar casos especiales de nombres de autores en el que el algoritmo presenta un bajo desempeño en comparación con el promedio. Este hallazgo permitió identificar una asociación aparente entre el bajo desempeño del algoritmo en contextos de varios autores con un mismo nombre y con pocas publicaciones.
Descargas
Citas
Ferreira, A. A., Gonçalves, M. A., & Laender, A. H. F. (2012). A Brief Survey of Automatic Methods for Author Name Disambiguation. SIGMOD Rec., 41(2), 15–26. https://doi.org/10.1145/2350036.2350040
Kuna, H., Cantero, A., Canteros, A., Rey, M., Zamudio, E., Rambo, A., Martini, E., Pautsch, G., Biale, C., Krujoski, S., & Rauber, F. (2019). Avances en el desarrollo de métodos de Desambiguación y Recomendación de Autores Científicos para un Metabuscador de las Ciencias de la Computación. XXI Workshop de Investigadores en Ciencias de la Computación, 198-202. http://www.wicc2019.unsj.edu.ar/descargas/Libro_WICC2019.pdf
Kuna, H., Rey, M., Zamudio, E., Olivas, J. A., Rambo, A., Cantero, A., Canteros, A., Martini, E., & Biale, C. (2017). An Entity Profile Schema for Data Integration in an Academic Metasearch Engine. Proceedings of the 2017 International Conference on Artificial Intelligence, 281–285. http://csce.ucmss.com/cr/books/2017/ConferenceReport?ConferenceKey=ICA
Liu, Y., Li, W., Huang, Z., & Fang, Q. (2015). A fast method based on multiple clustering for name disambiguation in bibliographic citations. Journal of the Association for Information Science and Technology, 66(3), 634-644. https://doi.org/10.1002/asi.23183
Santana, A. F., Gonçalves, M. A., Laender, A. H. F., & Ferreira, A. A. (2017). Incremental Author Name Disambiguation by Exploiting Domain-specific Heuristics. J. Assoc. Inf. Sci. Technol., 68(4), 931–945. https://doi.org/10.1002/asi.23726
Shoaib, M., Daud, A., & Amjad, T. (2020). Author Name Disambiguation in Bibliographic Databases: A Survey. arXiv preprint arXiv:2004.06391.
Tang, J., Fong, A. C. M., Wang, B., & Zhang, J. (2012). A Unified Probabilistic Framework for Name Disambiguation in Digital Library. IEEE Transactions on Knowledge and Data Engineering, 24(6), 975-987. https://doi.org/10.1109/TKDE.2011.13
Tang, Jie. (2016a). AMiner: Mining deep knowledge from big scholar data. Proceedings of the 25th international conference companion on world wide web, 373–373.
Tang, Jie. (2016b). AMiner: Toward understanding big scholar data. Proceedings of the ninth ACM international conference on web search and data mining, 467–467.
Wan, H., Zhang, Y., Zhang, J., & Tang, J. (2019). Aminer: Search and mining of academic social networks. Data Intelligence, 1(1), 58–76.
Wang, H., Wang, R., Wen, C., Li, S., Jia, Y., Zhang, W., & Wang, X. (2020). Author Name Disambiguation on Heterogeneous Information Network with Adversarial Representation Learning. arXiv preprint arXiv:2002.09803.
Zhang, W., Yan, Z., & Zheng, Y. (2019). Author Name Disambiguation Using Graph Node Embedding Method. 2019 IEEE 23rd International Conference on Computer Supported Cooperative Work in Design (CSCWD), 410–415.
Zhang, Y., Zhang, F., Yao, P., & Tang, J. (2018). Name Disambiguation in AMiner: Clustering, Maintenance, and Human in the Loop. Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, 1002–1011.
Zhu, J., Wu, X., Lin, X., Huang, C., Fung, G. P., & Tang, Y. (2018). A Novel Multiple Layers Name Disambiguation Framework for Digital Libraries Using Dynamic Clustering. Scientometrics, 114(3), 781–794. https://doi.org/10.1007/s11192-017-2611-8
Sasaki, Y. (2007). The truth of the F-measure. Teach Tutor Mater.
Van Rijsbergen, C. (1979). Information Retrieval | Guide books. https://dl.acm.org/doi/book/10.5555/539927
Los artículos publicados en la Revista Ciencia y Tecnología son de exclusiva propiedad de sus autores. Las opiniones y el contenido de los mismos pertenecen a sus autores, declinando la Universidad de Palermo toda responsabilidad por los derechos que pudiera derivarse de la lectura y/o interpretación del contenido de los artículos publicados.
No se autoriza la reproducción, utilización ni explotación por parte de ningún tercero de los artículos publicados. Sólo se autoriza su uso para fines exclusivamente académicos y/o de investigación.