Eva María Domínguez Noya, María Sol López Martínez
This paper focuses on how the available resources for information retrieval inlinguistic corpora can be enhanced by considering the gender perspective. It takes a two-foldapproach: on the one hand, the morphosyntactic annotation of inclusive language is exploredand, on the other, an author’s gender is taken into account as a new search option. To this end, the Current Galego Reference Corpus (Corpus de Referencia do Galego Actual, CORGA) isfi rst described, and the options provided for direct non-binary language retrieval are contrasted with those existing in the Spanish Twenty-First Century Corpus (Corpus del Español delSiglo XXI, CORPES). Using a generic or inclusive value in the gender fi eld in CORGA hassignifi cantly improved search results since it allows to retrieve words showing this feature andto present data on how often they occur—globally and by particular forms. The frequency anddistribution of available options (amig@, amigo/a, amiga/o, amigx, amig*, amigue) in CORGAis then analysed, both in quantitative and qualitative terms. Next, other Galician, Catalan,Portuguese and Spanish corpora are examined to see whether they include specifi c metadata or search fi elds regarding an author’s gender. The article concludes that this parametercould be very helpful both in oral and written discourse. Additionally, distinguishing betweenthe author and the interlocutor/speaker/character fi elds could facilitate studying speech differences between women and men, as well as allow gender cross-searches in those fields.
Este traballo céntrase na mellora dos recursos dispoñibles para a recuperación dainformación en corpus lingüísticos en relación coa perspectiva de xénero nun dobre sentido:por un lado, aténdese á anotación morfosintáctica da linguaxe inclusiva e, polo outro, á incorporación do sexo do autor como parámetro a ter en conta na extracción de información. Así,tras presentar o CORGA, contrástanse as posibilidades que este ofrece para a recuperaciónda linguaxe non binaria directa co CORPES, e conclúese que, fronte ás difi cultades que presenta o corpus español, a consideración dun valor específi co na categoría gramatical xénerodenominado xenérico ou inclusivo resulta determinante no CORGA para saber en que palabras e con que frecuencia se manifestan estas formas, tanto globalmente como por formaespecífi ca, e cales das opcións dispoñibles (amig@, amigo/a, amiga/o, amigx, amig*, amigue)acadan maior protagonismo. A continuación, analízase cuantitativa e cualitativamente o seuemprego e distribución en galego. Finalmente, realízase unha panorámica sobre a presenzado sexo do autor como metadato e/ou criterio de busca en corpus do galego, catalán, portugués e español, e establécese a conveniencia de incluílo, ademais de na vertente oral, taméncomo un parámetro de procura na compoñente escrita. Por último, preséntase a necesidadede diferenciar entre autor e interlocutor/falante/personaxe para, alén de favorecer o estudoda fala feminina ou masculina, facilitar os cruzamentos entre autores dun sexo dado e personaxes do sexo contrario.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados