Ayuda
Ir al contenido

Dialnet


Nuevas vías para la recuperación de información en corpus históricos: clasificación del vocabulario

  • Autores: María Agujetas Ortiz, Pedro Sánchez-Prieto Borja
  • Localización: Scriptum digital: revista de corpus diacrònics i edició digital en llengües iberoromàniques, ISSN-e 2014-640X, Nº. 11, 2022, págs. 5-54
  • Idioma: español
  • Títulos paralelos:
    • New techniques for information retrieval in historical corpora: vocabulary classification
  • Enlaces
  • Resumen
    • español

      El objetivo de este artículo es explorar la aplicación de modelos ontológicos en corpus diacronicos, ensayada en el subcorpus CN de CODEA; para ello, se ha procedido a la lematización interactiva y los lemas resultantes se han clasificado en una estructura jerárquica de tres niveles, próxima a las de las taxonomías. Los vínculos semánticos entre palabras vienen reforzados por su presencia, a veces, en más de un campo nocional. Se ha explorado también la navegación por raíces léxicas, estableciendo así asociaciones inmediatas entre palabras formalmente relacionadas. De esta manera, será posible la recuperación de información semántica, lo que constituirá un avance significativo respecto de las búsquedas meramente formales.

    • English

      The aim of this paper is to explore the application of ontological models in diachronic corpora. It has been tested in the CN subcorpora of CODEA. First of all, interactive lemmatisation has been carried out; the resulting lemmas have then been classified in a three-level hierarchical structure, similar to taxonomies. The semantic links between words are reinforced by their presence in more than one notional field. Navigation through lexical roots has also been explored, allowing the immediate associations are established between formally related words. In this way, the retrieval of semantic information will be possible, which will constitute significant progress compared with purely formal searches.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno