Ayuda
Ir al contenido

Dialnet


Transforming a constituency treebank into a dependency treebank

  • Autores: Alexander F. Gelbukh, Sulema Torres, Hiram Calvo
  • Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 35, 2005, págs. 145-152
  • Idioma: inglés
  • Enlaces
  • Resumen
    • español

      Presentamos una técnica heurística para convertir un corpus anotado sintácticamente dentro del formalismo de constituyentes, a un corpus anotado dentro del formalismo de dependencias. Particularmente comentamos sobre nuestra experiencia en convertir el corpus Cast3LB del español. El método consiste en extracción de una gramática libre de contexto del corpus etiquetado, identificación automática del elemento rector en cada regla, y usando esta información para la construcción del árbol de dependencias. Nuestras heurísticas identifican el elemento rector de las reglas con precisión de 99% y cobertura de 80%, con lo que el algoritmo identifica correctamente 92% de las relaciones de dependencias entre las palabras

    • English

      We present a heuristic technique for converting a constituency treebank into a dependency treebank. In particular, we comment on our experience in converting the Spanish treebank Cast3LB. We extract a context-free grammar from the treebank, automatically identify the head in each rule, and use this information for constructing the dependency tree. Our heuristics have 99% precision and 80% recall in identifying the head in the rules, which gives 92% accuracy in identifying dependencies between words


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno