Ayuda
Ir al contenido

Dialnet


Resumen de Mark-up and Annotation in the "Corpus of Historical English Law Reports" (CHELAR): Potential for Historical Genre Analysis

Paula Rodríguez Puente, Cristina Blanco García, Iván Tamaredo Meira

  • español

    El etiquetado y anotación lingüística de un corpus se ha convertido en una práctica generalizada en las últimas décadas, con el objetivo de facilitar la extracción de datos del propio corpus, así como garantizar que los corpus nuevos son compatibles con otros ya existentes o creados con posterioridad. El presente artículo tiene una doble finalidad. Por una parte, proporcionamos un análisis de las principales formas de etiquetado y anotación que están a nuestra disposición. Tomando como ejemplo el Corpus of Historical English Law Reports 1535-1999 (CHELAR), un corpus especializado de decisiones judiciales, ilustraremos el modo en que estos etiquetados pueden implementarse de forma sencilla para su posterior aprovechamiento. En segunda instancia, presentamos un resumen de los trabajos de investigación que se han llevado a cabo hasta la fecha con CHELAR, y que se han centrado principalmente en identificar las características lingüísticas significativas de las decisiones judiciales, así como en investigar la evolución del lenguaje de estos documentos durante casi cinco siglos. Nuestro trabajo ilustra las múltiples ventajas de la implementación de un sistema de anotación simplificado y las mejoras que este supone para el análisis textual desde la perspectiva histórica.

  • English

    Adding annotation and mark-up to linguistic corpora has become a standard practice in corpus building over the past few decades as a way to facilitate data extraction and at the same time guarantee that new corpora are compatible with existing and future tools. The purpose of this article is twofold. First, we provide an overview of the main forms of annotation and mark-up available to the research community and how they have been applied to the Corpus of Historical English Law Reports 1535-1999 (CHELAR), a specialized corpus consisting of law reports or records of judicial decisions. Second, we give an account of preliminary research based on the annotated versions of CHELAR, which so far has been primarily aimed at identifying the distinctive linguistic characteristics of law reports, as well as at investigating how the language of law reports has evolved over a time span of almost five centuries. Our article illustrates the multiple advantages of applying a simple annotation schema to a corpus and how this can enhance the potential of a corpus for historical genre analysis.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus