Aproximación a la categorización textual en español basada en la semántica de marcos

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/8066
Información del item - Informació de l'item - Item information
Título: Aproximación a la categorización textual en español basada en la semántica de marcos
Título alternativo: Frame semantics based approach to Spanish textual categorization
Autor/es: Crespo Miguel, Mario | Frías Delgado, Antonio
Palabras clave: FrameNet | Categorización textual | Recuperación de información | Textual categorization | Information retrieval
Fecha de publicación: sep-2008
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: CRESPO MIGUEL, Mario; FRÍAS DELGADO, Antonio. “Aproximación a la categorización textual en español basada en la semántica de marcos”. Procesamiento del lenguaje natural. N. 41 (sept. 2008). ISSN 1135-5948, pp. 65-71
Resumen: FrameNet es un recurso basado en la Semántica de Marcos que trata de representar el modo por el que diferentes lenguas dan cuenta lingüísticamente de situaciones cotidianas. Los marcos funcionan al modo de paquetes de información sobre cómo hablar de una determinada situación. Este trabajo presenta un procedimiento para categorizar documentos a partir del análisis de las situaciones de FrameNet que concurren en un texto determinado. El conjunto de marcos situacionales es usado como un vector de rasgos en el que la presencia o ausencia de determinados marcos situacionales en un texto sirve para establecer su categoría. Los resultados muestran cómo nuestro sistema fue capaz de categorizar textos en español con gran precisión. | FrameNet is a resource based on Frame Semantics that comprises how languages account for daily situations linguistically. Frames represent information packets about how to convey information about a certain situation. This paper presents an approach to categorize texts by analysing the range of FrameNet situations that co-occur in a particular text. The set of FrameNet situations is used as a feature vector where the presence or absence of certain frames in a text is used to determine its category. Results show how our system was able to categorize texts in Spanish with high accuracy.
URI: http://hdl.handle.net/10045/8066
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 41 (septiembre 2008)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_41_08.pdf207,41 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.