Ayuda
Ir al contenido

Dialnet


Adquisición automática de información léxica y morfosintáctica a partir de corpus sin anotar: aplicación al serbo-croata y ruso

  • Autores: Antoni Oliver González, Lluís Màrquez, Irene Castellón Masalles
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 29, 2002 (Ejemplar dedicado a: XVII Congreso de la SEPLN. Universidad de Valladolid, 11-13 septiembre 2002), págs. 97-104
  • Idioma: español
  • Enlaces
  • Resumen
    • español

      Un problema crucial en el desarrollo de los sistemas para el análisis morfológico automático de los idiomas flexivos es el tratamiento de las alternaciones de la base. Los modelos existentes requieren el desarrollo de las reglas correspondientes que especifican qué variantes dela base se pueden generar de la variante dada. Un gran número de tales reglas (por ejemplo, para el lenguaje ruso alrededor de un mil) no tiene ninguna interpretación lingüística razonable. Sugerimos un método que evite el uso de tales reglas gracias a la generación y verificación de las hipótesis sobre las formas gramaticales posibles. Los métodos de este tipo -conocidos como análisis a través de generación- hacen el desarrollo de sistemas mucho más simple que el enfoque directo estándar. Un sistema para el análisis y la generación morfológica para el lenguaje ruso, desarrollado con nuestro método está disponible sin costo para el uso académico; el sistema para el español está bajo desarrollo

    • English

      This paper presents a methodology for the automatic acquisition of lexical and morpho-syntactic information from raw corpora. The system uses information about the inflectional morphology of the language and lexical and morpho-syntactic information of the words belonging to non-inflectional categories and of the words not belonging to regular paradigms.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno