Esta tesis aborda la lematización de la poesía en inglés antiguo, llenando un vacío crucial en los campos de la lexicografía, la lingüística de corpus y la lingüística histórica. En concreto, este estudio se centra en agrupar de manera sistemática las formas atestiguadas del York-Helsinki Parsed Corpus of Old English Poetry (Pintzuk y Plug 2001) bajo un lemma unificado, utilizando la base de datos relacional Interface of Old English Dictionaries (IOED). Esta base de datos integra los las principales fuentes lexicograficas del inglés antiguo entre las que se incluyen: DOE, BT, VariOE, Norna, Freya, ParCorEv2, Unimorph e INESS. De esta forma, la IOED conecta los lemas y las formas atestiguadas de las distintas fuentes, facilitando un proceso ordenado y eficaz para comparar y escoger el lema más adecuado para cada forma. La metodología se compone de cuatro pasos principales. Primero, se compila el inventario de formas atestiguadas del YCOEP para crear una base de datos estructurada que facilite su clasificación. Posteriormente, estas formas se correlacionan con las fuentes del IOED para asignar los lemas de forma automática o semiautomatica según se requiera. En el siguiente paso, los lemas asignados se alinean con la lista definitiva de lemas de ParCorEv2 para asegurar la coherencia.. Finalmente, se evalúa el rendimiento de la IOED y se valida el inventario lematizado resultante comparándolo con el DOE, VariOE y A Short Dictionary of Anglo-Saxon Poetry de Bessinger (1960), con el fin de identificar y evaluar las posibles discrepancias en la selección de lemas. Las principales conclusiones de esta investigación destacan las contribuciones generadas a partir del inventario lematizado, así como las limitaciones de este marco, que abren camino a futuros análisis digitales mejorados del inglés antiguo.
This dissertation addresses the lemmatisation of Old English poetry, filling a crucial gap in the fields of Lexicography, corpus linguistics and Historical linguistics. To be more precise, this study aims to systematically group the attested spellings of the York-Helsinki Parsed Corpus of Old English Poetry (Pintzuk and Plug 2001) under a unified headword using the Interface of Old English Dictionaries (IOED) relational database framework. This relational database integrates key Old English lexicographical resources, including the Dictionary of Old English (DOE), Bosworth-Toller (BT), VariOE, Norna, Freya, ParCorEv2, Unimorph, and INESS. To that aim, the IOED correlates the headwords and attested spellings of these sources, providing a streamlined, comprehensive framework for systematically comparing and selecting the most suitable lemma for each attested spelling. The methodology consists of four systematic steps to complete the lemmatisation of the YCOEP. First, the YCOEP inventory of attested spellings creates a structured database for classification. Then, these spellings are matched with sources from the IOED to assign headwords automatically. Next, the assigned headwords are aligned with the ParCorOEv2 lemma list for consistency. Finally, the IOED performance is evaluated, and the resulting lemmatised inventory is validated against DOE, VariOE and Bessinger’s (1960) short dictionary of Anglo-Saxon poetry to identify and assess any discrepancies in headword selection. The main conclusions of this research point to the main contributions generated from the lemmatised inventory as well as the limitations of this framework, which pave the way for enhanced digital analyses of OE.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados