Proverbs are expressions of widespread use, appearing in different conversational situations, and assume different functions in the discourse in which they are integrated. From a syntactic point of view, this type of expression presents a great variety of structures. With this in mind, the main goal of this study is to determine a formal syntactic classification of the European Portuguese proverbs. For this, we intend to develop and extend the typology of the formal classification proposed by Rassi et al. (2014). Therefore, a subclassification for the classes with a large number of proverbs, and a possible reclassification of some of the types will be considered. The classification proposal was validated by having two linguists independently annotating a list of very usual proverbs, and then calculating the inter-annotator agreement, which was found to be very high. This classification, in turn, will be the starting point for the development of an automatic classification procedure, and thus contribute to the preparation of resources for different applications in Natural Language Processing (NLP).
Os provérbios são expressões de uso generalizado, utilizados em diferentes situações conversacionais e assumindo diferentes funções no discurso em que se integram. Do ponto de vista sintático, este tipo de expressões apresenta uma grande variedade de estruturas. Tendo isto em conta, o objetivo principal deste trabalho é estabelecer uma classificação formal sintática dos provérbios do português europeu. Para tal, pretendemos desenvolver e aprofundar a tipologia de classificação formal proposta por Rassi et al. (2014). Por conseguinte, será considerada uma subclassificação para as classes que apresentam um elevado número de provérbios e uma eventual reclassificação de alguns dos tipos. A proposta de classificação foi validada pela anotação independente por dois linguistas de uma lista de provérbios muito usuais, medindo-se depois o acordo entre anotadores, que foi muito elevado. Esta classificação, por sua vez, será o ponto de partida para o desenvolvimento de um procedimento de classificação automática deste tipo de estruturas, e contribuir assim para a elaboração de recursos para diferentes aplicações em Processamento da Linguagem Natural (PLN).
© 2001-2026 Fundación Dialnet · Todos los derechos reservados