Ayuda
Ir al contenido

Dialnet


Cadlaws – An English–French Parallel Corpus of Legally Equivalent Documents

    1. [1] Universitat Autònoma de Barcelona

      Universitat Autònoma de Barcelona

      Barcelona, España

    2. [2] Universitat Oberta de Catalunya

      Universitat Oberta de Catalunya

      Barcelona, España

  • Localización: Mutatis Mutandis: Revista Latinoamericana de Traducción, ISSN-e 2011-799X, Vol. 14, Nº. Extra 2, 2021 (Ejemplar dedicado a: Nuevas perspectivas de investigación en la traducción especializada en lenguas románicas: aspectos comparativos, léxicos, fraseológicos, discursivos y didácticos), págs. 494-508
  • Idioma: inglés
  • Títulos paralelos:
    • Cadlaws - Un corpus parallèle anglais-français de documents juridiquement équivalents
    • Cadlaws: un corpus paralelo de documentos jurídicos equivalentes inglés-francés
  • Enlaces
  • Resumen
    • español

      Este artículo presenta Cadlaws, un nuevo corpus en los pares de lenguas inglés y francés, creado con base en documentos legales canadienses. Describe el proceso de construcción del corpus y las estadís­ticas preliminares que se obtuvieron de aquél. Este corpus contiene más de 16 millones de vocablos en cada idioma e incluye características únicas, pues está conformado por documentos equivalentes desde el punto de vista jurídico en ambos idiomas como lengua de partida. El corpus se basó en autos legales redactados de manera conjunta por dos juristas para garantizar la equivalencia jurídica de cada versión y reflejar los conceptos, términos e instituciones de dos tradiciones del derecho. En este artículo, también se estudia la definición de corpus como corpus paralelo en oposición al corpus comparable. Cadlaws se procesó previamente para traducción automática y el suplente de evaluación bilingüe de referencia (bleu, por sus siglas en inglés), un puntaje que sirve para comparar un texto presentado como candidato para la traducción de un texto contra una traducción considerada patrón de referencia en un sistema de traducción automática neuronal. Hasta donde sabemos, este es el corpus paralelo de textos con el mismo significado en este par de lenguas más extenso que existe, y ofrece libre acceso para uso no comercial.

    • English

      This article presents Cadlaws, a new English–French corpus built from Canadian legal documents, and describes the corpus construction process and preliminary statistics obtained from it. The corpus contains over 16 million words in each language and includes unique features since it is composed of documents that are legally equivalent in both languages but not the result of a translation. The corpus is built upon enactments co-drafted by two jurists to ensure legal equality of each version and to re­flect the concepts, terms and institutions of two legal traditions. In this article the corpus definition as a parallel corpus instead of a comparable one is also discussed. Cadlaws has been pre-processed for machine translation and baseline Bilingual Evaluation Understudy (bleu), a score for comparing a candidate translation of text to a gold-standard translation of a neural machine translation system. To the best of our knowledge, this is the largest parallel corpus of texts which convey the same meaning in this language pair and is freely available for non-commercial use.

    • français

      Cet article présente Cadlaws, un nouveau corpus anglais-français construit à partir de documents juri­diques canadiens. L’article décrit le processus de construction du corpus ainsi que les statistiques pré­liminaires obtenues à partir de celui-ci. Le corpus contient plus de 16 millions de mots dans chaque langue et présente des caractéristiques uniques puisqu’il est composé de documents juridiquement équivalents dans les deux langues mais qui ne sont pas le résultat d’une traduction. Le corpus est construit à partir de textes co-rédigés par deux juristes afin de garantir l’égalité juridique de chaque version et de refléter les concepts, termes et institutions de deux traditions juridiques. Dans cet article, la définition du corpus comme un corpus parallèle au lieu d’un corpus comparable est également discutée. Cadlaws a été prétraité pour la traduction automatique et offre la valeur d’évaluation bleu (Bilingual Evaluation Understudy), un score permettant de comparer une traduction avec la norme d’un système de traduction automatique neuronal. À notre connaissance, il s’agit du plus grand cor­pus parallèle de textes véhiculant le même sens dans cette paire de langues et il est disponible gratui­tement pour une utilisation non commerciale.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno