Se describe una herramienta que mediante una aproximación multidimensional permite la estructuració y clasificación de textos. El fin que persigue es el estudio de las distintas secciones del documento. En el desarrollo del módulo se emplearon algoritmos de filtrado (N-grams)) y de clasificación (K-means y Chen). La estructuración de los documentos se ralizó mediante marcadores lingüísticos, tipográficos y herramienta estadísticas. Para la evaluación del método se recopliraron de Medline documentos médicos a texto completo y se incorporó una herramineta de comparación, el MeSH. Mediante un análisis estadístico y comparativo, se ha comprobado al necesidad y validez de este tipo de aproximaciones. Por último, se propone la integración del método en un módulo que optimice la asignación de pesos en el diseño de herramientas de clasificación y recuperación documental.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados