Filtrado de información para la búsqueda de respuestas

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/3273
Información del item - Informació de l'item - Item information
Título: Filtrado de información para la búsqueda de respuestas
Autor/es: Noguera Robles, Elisa | Llopis, Fernando | Ferrández, Antonio
Palabras clave: Recuperación de información | Búsqueda de respuestas | Information retrieval | Question answering
Fecha de publicación: sep-2006
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: NOGUERA ROBLES, Elisa; LLOPIS PASCUAL, Fernando; FERRÁNDEZ RODRÍGUEZ, Antonio. "Filtrado de información para la búsqueda de respuestas". Procesamiento del lenguaje natural. N. 37 (sept. 2006). ISSN 1135-5948, pp. 145-152
Resumen: La complejidad de los sistemas de Búsqueda de Respuestas (BR) dificulta que sean aplicados a grandes colecciones de documentos. Por este mótivo, los sistemas de BR utilizan como paso previo un sistema de Recuperación de Información (RI), para detectar los documentos relevantes y disminuir de esta forma la información a procesar. En este artículo, presentamos un método para filtrar los documentos no relevantes en el contexto de BR. Concretamente, el método aplicado para filtrar información está basado en el teorema del valor medio. Hemos evaluado este método con tres medidas de similitud distintas: la medida del coseno, okapi y dfr. En los experimentos obtenemos una reducción de hasta el 89% de información sin apenas pérdida significativa en la precisión. Además, mediante este método, mejoramos un 7.05% la precisión global de un sistema de BR. | The complexity of the Question Answering (QA) systems difficults their application to large collections of documents. For this reason, QA systems use Information Retrieval (IR) as preliminary stage in order to detect the relevant documents and decrease the processing data. This paper studies the problem of filtering information in the context of QA. Specifically, we have applied the Mean-Value Theorem in order to filtering data without loss precision in the results. This method has been tested with three similarity measures: cosine, okapi and dfr. In the experiments, we achieved a 89% data reduction without significant data loss. Moreover, this method improves a 7.05% the precision of the QA system.
Patrocinador/es: Esta investigación ha sido financiada por el Ministerio de Ciencia y Tecnología (MCYT) con el proyecto CICyT número TIC2003-07158-C04-01.
URI: http://hdl.handle.net/10045/3273
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 37 (septiembre 2006)
INV - GPLSI - Artículos de Revistas
INV - I+GE - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_37_19.pdf130,94 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.