Extracción de relaciones sintagmáticas de corpus anotados

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/3230
Información del item - Informació de l'item - Item information
Título: Extracción de relaciones sintagmáticas de corpus anotados
Autor/es: Navarro Colorado, Borja | Moreno Monteagudo, Lorenza | Martínez-Barco, Patricio
Palabras clave: Corpus | WSD | Corpora
Fecha de publicación: sep-2006
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: NAVARRO COLORADO, Francisco de Borja; MORENO MONTEAGUDO, Lorenza; MARTÍNEZ BARCO, Patricio. "Extracción de relaciones sintagmáticas de corpus anotados". Procesamiento del lenguaje natural. N. 37 (sept. 2006). ISSN 1135-5948, pp. 67-73
Resumen: En este trabajo se presenta un nuevo recurso, diseñado con el objetivo de ser usado en desambiguación semántica de las palabras en español, basado en las relaciones sintagmáticas entre las palabras. Las relaciones sintagmáticas son relaciones entre sentidos dentro de un sintagma o dentro de una oración. En nuestro caso, estas relaciones han sido extraídas de un corpus anotado manualmente, corpus Cast3LB. Este corpus ha sido anotado con información sintáctica (constituyentes y funciones) e información semántica (sentidos de WordNet). De este corpus se han extraído aproximadamente 3000 patrones. Cada patrón muestra la relación sintagmática entre el sentido del verbo y el sentido de sus argumentos dentro de una oración. Sin embargo, estos patrones son excesivamente específicos para ser usados en contextos multilingües o en documentos de dominio general. Para solucionar esto es necesario obtener patrones más generales semánticamente, para lo cual se ha utilizado la ontología SUMO. | In this paper, we present a new resource, designed for being used in WSD, based on syntagmatic relations between senses for Spanish. These relations have been extracted from a corpus: the Cast3LB corpus which has been manually annotated with syntactic and semantic information (WordNet senses). From it, approximately 3000 patterns have been extracted. These patterns show the syntagmatic relations between verb senses and its arguments within a sentence. However, these patterns can be too specific to be used in multilingual contexts or in open domain texts. Consequently, it is necessary to obtain more abstract patterns. In order to do so, we have also developed general patterns using semantic classes based on the SUMO ontology.
Patrocinador/es: Este trabajo ha sido parcialmente financiado por el proyecto CES-ECE (HUM2004-21127-E) y el proyecto R2D2 (TIC2003-07158-C04-01).
URI: http://hdl.handle.net/10045/3230
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 37 (septiembre 2006)
INV - GPLSI - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_37_09.pdf382,72 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.