Aproximación a la categorización textual en español basada en la semántica de marcos
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/8066
Título: | Aproximación a la categorización textual en español basada en la semántica de marcos |
---|---|
Título alternativo: | Frame semantics based approach to Spanish textual categorization |
Autor/es: | Crespo Miguel, Mario | Frías Delgado, Antonio |
Palabras clave: | FrameNet | Categorización textual | Recuperación de información | Textual categorization | Information retrieval |
Fecha de publicación: | sep-2008 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | CRESPO MIGUEL, Mario; FRÍAS DELGADO, Antonio. “Aproximación a la categorización textual en español basada en la semántica de marcos”. Procesamiento del lenguaje natural. N. 41 (sept. 2008). ISSN 1135-5948, pp. 65-71 |
Resumen: | FrameNet es un recurso basado en la Semántica de Marcos que trata de representar el modo por el que diferentes lenguas dan cuenta lingüísticamente de situaciones cotidianas. Los marcos funcionan al modo de paquetes de información sobre cómo hablar de una determinada situación. Este trabajo presenta un procedimiento para categorizar documentos a partir del análisis de las situaciones de FrameNet que concurren en un texto determinado. El conjunto de marcos situacionales es usado como un vector de rasgos en el que la presencia o ausencia de determinados marcos situacionales en un texto sirve para establecer su categoría. Los resultados muestran cómo nuestro sistema fue capaz de categorizar textos en español con gran precisión. | FrameNet is a resource based on Frame Semantics that comprises how languages account for daily situations linguistically. Frames represent information packets about how to convey information about a certain situation. This paper presents an approach to categorize texts by analysing the range of FrameNet situations that co-occur in a particular text. The set of FrameNet situations is used as a feature vector where the presence or absence of certain frames in a text is used to determine its category. Results show how our system was able to categorize texts in Spanish with high accuracy. |
URI: | http://hdl.handle.net/10045/8066 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 41 (septiembre 2008) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_41_08.pdf | 207,41 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.