Linguistically-driven Selection of Correct Arcs for Dependency Parsing

Felice Dell'Orletta; Giulia Venturi; Simonetta Montemagni

Ayuda

Linguistically-driven Selection of Correct Arcs for Dependency Parsing

Felice Dell'Orletta ^[1] ; Giulia Venturi ^[2] ; Simonetta Montemagni ^[1]
1. [1] National Research Council Istituto di Linguistica Computazionale Italian Natural Language Processing Lab
2. [2] National Reseach Council Istituto di Linguistica Computazionale Italian Natural Language Processing Lab
Localización: Computación y Sistemas (CyS), ISSN 1405-5546, ISSN-e 2007-9737, Vol. 17, Nº. 2, 2013, págs. 125-136
Idioma: inglés
Títulos paralelos:
- Selección de los arcos correctos basada en información lingüística para análisis sintáctico de dependencias
Enlaces
- Texto completo
Resumen
- español
  LISCA es un algoritmo no supervisado cuyo objetivo es asignar un puntaje cualitativo a cada arco generado por el analizador sintáctico de dependencias con el fin de producir un ranking decreciente de los arcos desde los correctos hasta los incorrectos. LISCA usa la estadística del conjunto de características basadas en la información lingüística y dependencias que se extraen del corpus grande de frases analizadas sintácticamente por la computadora y las utiliza para asignar un puntaje cualitativo a cada arco de la frase analizada que pertenece al mismo dominio del corpus. LISCA se probo exitosamente utilizando dos conjuntos de datos de dos dominios distintos y en todos los experimentos su rendimiento fue mejor que el de varios métodos de referencia; así se demostró su capacidad de detectar los arcos correctos de manera confiable representando también las características específicas de los dominios.
- English
  LISCA is an unsupervised algorithm aimed at assigning a quality score to each arc generated by a dependency parser in order to produce a decreasing ranking of arcs from correct to incorrect ones. LISCA exploits statistics about a set of linguistically-motivated and dependency-based features extracted from a large corpus of automatically parsed sentences and uses them to assign a quality score to each arc of a parsed sentence belonging to the same domain of the automatically parsed corpus. LISCA has been successfully tested on two datasets belonging to two different domains and in all experiments it turned out to outperform different baselines, thus showing to be able to reliably detect correct arcs also representing domain-specific peculiarities.

Los metadatos del artículo han sido obtenidos de SciELO México

Acceso de usuarios registrados

¿Olvidó su contraseña?

¿Es nuevo? Regístrese

Ventajas de registrarse

Dialnet Plus

Opciones de compartir

Opciones de entorno

Sugerencia / Errata

Coordinado por: