Ayuda
Ir al contenido

Dialnet


Resumen de Clasificación de textos en lenguaje natural usando la Wikipedia

Jose María Quinteiro González, Ernestina Martel Jordán, Pablo Hernández Morera, Juan A. Ligero Fleitas, Aaron López Rodriguez

  • español

    La clasificación de textos, en entornos en los que el volumen de datos a clasificar es tan elevado que resulta muy costosa la realización de esta tarea por parte de humanos, requiere la utilización de clasificadores de textos en lenguaje natural automáticos. El clasificador propuesto en el presente estudio toma como base la Wikipedia para la creación del corpus que define una categoría mediante técnicas de Procesado de Lenguaje Natural (PLN) que analizan sintácticamente los textos a clasificar. El resultado final del sistema propuesto presenta un alto porcentaje de acierto, incluso cuando se compara con los resultados obtenidos con técnicas alternativas de Aprendizaje Automático.

  • English

    Automatic Text Classifiers are needed in environments where the amount of data to handle is so high that human classification would be ineffective. In our study, the proposed classifier takes advantage of the Wikipedia to generate the corpus defining each category. The text is then analyzed syntactically using Natural Language Processing software. The proposed classifier is highly accurate and outperforms Machine Learning trained classifiers.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus