Improving parsing accuracy for Spanish using Maltparser
Empreu sempre aquest identificador per citar o enllaçar aquest ítem
http://hdl.handle.net/10045/13926
Títol: | Improving parsing accuracy for Spanish using Maltparser |
---|---|
Títol alternatiu: | Mejora de la precisión del análisis para el español con Maltparser |
Autors: | Ballesteros Martínez, Miguel | Herrera de la Cruz, Jesús | Francisco Gilmartín, Virginia | Gervás Gómez-Navarro, Pablo |
Paraules clau: | Análisis sintáctico de dependencias | Maltparser | Lengua española | Precisión | Dependency parsing | Spanish language | Accuracy |
Àrees de coneixement: | Lenguajes y Sistemas Informáticos |
Data de publicació: | d’abril-2010 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citació bibliogràfica: | BALLESTEROS MARTÍNEZ, Miguel, et al. “Improving parsing accuracy for Spanish using Maltparser”. Procesamiento del Lenguaje Natural. N. 44 (abr. 2010). ISSN 1135-5948, pp. 83-90 |
Resum: | En los ultimos años los sistemas basados en aprendizaje automático desarrollados para realizar análisis sintáctico de dependencias han alcanzado una gran precisión, pero ésta está normalmente por debajo del 90% en Labelled Attachment Score (LAS). Maltparser es un ejemplo de ese tipo de sistemas. El aprendizaje automático permite obtener analizadores para cada lengua para la que se disponga de un corpus de entrenamiento adecuado. Dado que generalmente tales sistemas no pueden ser modificados, surge la siguiente cuestión: ¿Se puede mejorar el 90% en LAS utilizando mejores corpora de entrenamiento? En este artículo describimos trabajos prospectivos sobre la cuestión, estudiando estrategias en las que se consideran tanto el tamaño del corpus como las longitudes de sus frases con el fin de obtener una mejor precisión en el análisis. | In the last years, dependency parsing has been accomplished by machine learning–based systems showing great accuracy but usually under 90% for Labelled Attachment Score (LAS). Maltparser is one of such systems. Machine learning allows to obtain parsers for every language having an adequate training corpus. Since generally such systems can not be modified the following question arises: Can we beat this 90% LAS by using better training corpora? In the present paper we show some prospective works on it. We studied some strategies considering training corpus’ size and its sentences’ length in order to obtain better parsing accuracy. |
Patrocinadors: | This work has been partially funded by Banco Santander Central Hispano and Universidad Complutense de Madrid under the Creación y Consolidación de Grupos de Investigación program, Ref. 921332–953. |
URI: | http://hdl.handle.net/10045/13926 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipus: | info:eu-repo/semantics/article |
Revisió científica: | si |
Apareix a la col·lecció: | Procesamiento del Lenguaje Natural - Nº 44 (abril 2010) |
Arxius per aquest ítem:
Arxiu | Descripció | Tamany | Format | |
---|---|---|---|---|
PLN_44_10.pdf | 935,54 kB | Adobe PDF | Obrir Vista prèvia | |
Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.