Automatic acquisition of lexical-semantic relations. Gathering information in a dense representation

Silvia Necsulescu

Ayuda

Automatic acquisition of lexical-semantic relations. Gathering information in a dense representation

Autores: Silvia Necsulescu
Directores de la Tesis: Núria Bel Rafecas (dir. tes.)
Lectura: En la Universitat Pompeu Fabra ( España ) en 2016
Idioma: español
Tribunal Calificador de la Tesis: M. Aranzazu Diaz de Ilarraza Sanchez (presid.), Francesco Ronzano (secret.), Alessandro Lenci (voc.)
Materias:
- Lingüística
  - Lingüística aplicada
    - Lingüística informatizada
  - Lingüística sincrónica
    - Semántica
    - Sintaxis y análisis sintáctico
Texto completo no disponible (Saber más ...)
Resumen
- Las relaciones léxico-semánticas entre palabras, por ejemplo hiperonimia, meronimia y cohiponimia, son una información clave para muchas tareas del Procesamiento del Lenguaje Natural, que requieren de este conocimiento en forma de recursos lingüísticos. El objetivo de esta tesis es la automatización del desarrollo de estos recursos, tratando la adquisición de instancias de estas relaciones: dada una relación semántica particular y un corpus de tex- tos en una lengua, el sistema produce pares de palabras que mantienen esa relación semántica. Los sistemas actuales utilizan representaciones basadas en patrones de los contextos donde co-ocurren las dos palabras relacionadas para detectar la relación léxico-semántica entre ellas. Este enfoque se en- fronta a problemas de falta de datos ya que una pre-condición para detectar la relación entre ellas es encontrar co-ocurrencias de esas palabras en el corpus. Incluso en el caso de trabajar con corpus de grandes dimensiones, habrá pares de palabras relacionadas que no co-ocurrirán o no con la fre- cuencia necesaria. Por tanto, nuestro principal objetivo ha sido proponer nuevas representaciones para predecir relaciones entre palabras, incluso cuando éstas no aparecen en la misma frase en un corpus en particular. La intuición era que estas representaciones nuevas debían contener informa- ción sobre patrones de contexto pero combinada con información sobre el significado de las palabras implicadas en la relación. Estas dos fuentes de información tenían que ser la base de una estrategia de generalización que ofreciera información incluso cuando las dos palabras no co-ocurrían. Así, proponemos dos representaciones nuevas que han mostrado resolver el problema de la falta de datos, como demuestra el hecho de que consiguen aumentar la cobertura en más de 20 puntos.

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: