Ayuda
Ir al contenido

Dialnet


Resumen de XPTA: um parser AMR para o Português baseado em uma abordagem entre línguas

Eloize Rossi Marques Seno, Helena M. Caseli, Marcio Inácio, Rafael Anchiêta, Renata Ramisch

  • English

    The growing interest in automatic semantic processing, especially by researchers in Natural Language Understanding and Natural Language Generation, has lead to several researches related to the development of semantic parsers. In this context, the semantic representation formalism of AMR (Abstract Meaning Representation) has received the most attention lately, due to its relatively simple way of capturing the meaning of a sentence. The development of AMR parser is mainly based on human-produced reference corpus. However, this resource is still quite scarce for many languages such as Portuguese. For this reason, several works have explored cross-lingual approaches, which make use of corpora and parsers available for a source language, to develop semantic resources to other target languages. Given this context, this paper describes XPTA, an AMR parser for Portuguese which is based on a cross-lingual approach. XPTA makes use of an existing parser for English and several English--Portuguese bilingual resources to map the semantic knowledge available in English to equivalent meaning representation in Portuguese. An automatic evaluation of XPTA showed that the adopted approach is promising and the results obtained for Smatch (66% in the best case) suggest that the model has the potential to compete with the results presented in the literature to others idioms. In addition to the automatic analysis, a qualitative analysis of the graphs produced by the parser allowed to identify and categorize the main mistakes of the model and their possible causes.

  • português

    O crescente interesse pelo processamento semântico automático, especialmente por parte dos pesquisadores de Compreensão e de Geração de Língua Natural, tem levado a muitas pesquisas relacionadas ao desenvolvimento de parsers semânticos. E, nesse contexto, a AMR (Abstract Meaning Representation) é um dos formalismos de representação semântica que tem recebido mais atenção recentemente, devido à sua maneira relativamente simples de capturar o significado de uma sentença. A construção de parsers AMR é em grande parte baseada em córpus de referência anotados por humanos. Contudo, esse recurso é ainda bastante escasso para muitas línguas como o português. Por esse motivo, várias pesquisas têm explorado o uso de abordagens entre línguas (cross-lingual), que partem de córpus e parser existentes em uma língua fonte, para o desenvolvimento de recursos semânticos para outras línguas alvo. Dado esse contexto, este artigo descreve o XPTA, um parser AMR para o português (PT) que se baseia na abordagem entre línguas (cross-lingual, X). O XPTA parte de parser AMR existente para o inglês e de vários recursos linguísticos-computacionais bilíngues inglês--português e mapeia o conhecimento semântico disponível no inglês para a representação do significado equivalente em português. Uma avaliação automática do XPTA mostrou que a abordagem adotada é promissora e os valores obtidos para Smatch (66%, no melhor caso) apontaram que o modelo tem potencial para competir com os resultados apresentados na literatura para outros idiomas. Além da análise automática, uma análise qualitativa dos grafos gerados possibilitou identificar e categorizar os principais erros do modelo e suas possíveis causas.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus