Las relaciones léxico-semánticas entre palabras, por ejemplo hiperonimia, meronimia y cohiponimia, son una información clave para muchas tareas del Procesamiento del Lenguaje Natural, que requieren de este conocimiento en forma de recursos lingüísticos. El objetivo de esta tesis es la automatización del desarrollo de estos recursos, tratando la adquisición de instancias de estas relaciones: dada una relación semántica particular y un corpus de tex- tos en una lengua, el sistema produce pares de palabras que mantienen esa relación semántica. Los sistemas actuales utilizan representaciones basadas en patrones de los contextos donde co-ocurren las dos palabras relacionadas para detectar la relación léxico-semántica entre ellas. Este enfoque se en- fronta a problemas de falta de datos ya que una pre-condición para detectar la relación entre ellas es encontrar co-ocurrencias de esas palabras en el corpus. Incluso en el caso de trabajar con corpus de grandes dimensiones, habrá pares de palabras relacionadas que no co-ocurrirán o no con la fre- cuencia necesaria. Por tanto, nuestro principal objetivo ha sido proponer nuevas representaciones para predecir relaciones entre palabras, incluso cuando éstas no aparecen en la misma frase en un corpus en particular. La intuición era que estas representaciones nuevas debían contener informa- ción sobre patrones de contexto pero combinada con información sobre el significado de las palabras implicadas en la relación. Estas dos fuentes de información tenían que ser la base de una estrategia de generalización que ofreciera información incluso cuando las dos palabras no co-ocurrían. Así, proponemos dos representaciones nuevas que han mostrado resolver el problema de la falta de datos, como demuestra el hecho de que consiguen aumentar la cobertura en más de 20 puntos.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados