Ayuda
Ir al contenido

Dialnet


Resumen de Clasificación de artículos académicos sobre la pandemia de COVID-19 a través de la técnica de minería de texto Word Embeddings

Bayron Fernando Vásquez Vanegas, Marcos Patricio Orellana Cordero

  • español

    La enfermedad de COVID-19, se introdujo y extendió rápidamente como una pandemia global, que necesitaba ser tratada con respuestas inmediatas, oportunas e integradas a los sistemas. Con la presencia de este virus SARS-CoV-2, la comunidad científica, las organizaciones, los individuos y la sociedad en general, han visto la necesidad de obtener información que pueda aportar conocimiento sobre la evolución de la enfermedad, posibles causas, consecuencias, tratamientos, prevención, entre otros aspectos. El presente artículo propone realizar la clasificación de artículos científicos publicados sobre la pandemia de COVID-19, con la aplicación de técnicas de Machine Learning, a través de mecanismos de representación semántica de palabras como el Word Embeddings y tecnologías basadas en redes neuronales; utilizando el análisis y procesamiento de los abstracts de artículos científicos disponibles en las fuentes de información como LitCovid. Los resultados describen los distintos mecanismos y metodologías de clasificación de texto y las maneras de representar el mismo, con el objeto de construir un modelo de clasificación fundamentado en la técnica de minería de texto Word Embeddings y en redes neuronales basadas en la arquitectura LSTM; obteniéndose la metodología a seguir para clasificar artículos científicos, así como, los resultados de desempeño de los modelos propuestos. Se concluye que, no se logró una predicción con resultados favorables en todas las clases, debido a que los datos están desbalanceados y existen clases muy mayoritarias en comparación a otras, por lo que las predicciones se vieron afectadas.

  • English

    The COVID-19 disease was rapidly introduced and spread as a global pandemic, which needed to be treated with immediate, timely and systems-integrated responses. With the presence of this SARS-CoV-2 virus, the scientific community, organizations, individuals and society in general have seen the need to obtain information that can provide knowledge about the evolution of the disease, possible causes, consequences, treatments, prevention, among other aspects. This article proposes to carry out the classification of scientific articles published on the COVID-19 pandemic, with the application of Machine Learning techniques, through mechanisms of semantic representation of words such as Word Embeddings and technologies based on neural networks;

    using the analysis and processing of the abstracts of scientific articles available in information sources such as LitCovid. The results describe the different text classification mechanisms and methodologies and the ways of representing it, in order to build a classification model based on the Word Embeddings text mining technique and on neural networks based on the LSTM architecture;

    obtaining the methodology to follow to classify scientific articles, as well as the performance results of the proposed models. It is concluded that a prediction with favorable results was not achieved in all classes, because the data is unbalanced and there are very majority classes compared to others, so the predictions were affected.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus