Ayuda
Ir al contenido

Dialnet


Can comparable corpora be compared?

  • Autores: Belén López Arroyo
  • Localización: Ibérica: Revista de la Asociación Europea de Lenguas para Fines Específicos ( AELFE ), ISSN-e 2340-2784, ISSN 1139-7241, Nº. 39, 2020, págs. 43-68
  • Idioma: inglés
  • Títulos paralelos:
    • Sobre la comparación de corpus comparables
  • Enlaces
  • Resumen
    • español

      Podemos afirmar que, hoy en día, no existe un acuerdo unánime sobre los criterios para compilar un corpus comparable o sobre cómo evaluar la comparabilidad de un corpus. Un corpus comparable es una colección de textos en diferentes lenguas o variaciones que son similares en ciertos aspectos. Pero, ¿en cuáles? Según McEnery y Wilson (2007: 20), la proporción en las muestras, el género, campo y tiempo deben ser los criterios principales a la hora de compilar un corpus comparable y deben ser los mismos en las diferentes lenguas.

      Sin embargo, estudios previos (López-Arroyo & Roberts, 2017) demuestran que estos criterios pueden no ser válidos en todos los campos. En el presente estudio, analizamos la comparabilidad desde el punto de vista del propósito del corpus.

      Para ello, hemos compilado un corpus comparable de 150 fichas de cata en inglés y 150 en español escritas por dos autoridades del campo y publicadas en las mismas décadas; según McEnery y Xiao (2007) nuestros subcorpus reúnen todos los requisitos para ser comparables. Sin embargo, nuestra metodología, centrada en el análisis de otros factores tales como El formato, el contenido y el estilo, demostrará que únicamente la proporción, el género, el campo, el tiempo y el tamaño no son siempre suficientes a la hora de comparar corpus

    • English

      While there is consensus on the definition of a comparable corpus, there is little or no agreement on what makes a corpus comparable or how to assess comparability. A comparable corpus consists of two or more collections of texts (subcorpora) in different languages or different language varieties, which are similar in some way. But in what way? According to McEnery and Xiao (2007: 20), proportion, genre, domain, and time constitute the main criteria when compiling a comparable corpus and must match in the different languages for the corpus to be considered comparable. However, in previous studies (LópezArroyo & Roberts, 2017), it has been shown by the analysis of two specialized comparable corpora that these criteria work well for certain fields, but not all. In the present study, we examine comparability from the point of view of the purpose for which a comparable corpus is to be used. In order to do that we have compiled a comparable corpus of 150 tasting notes in English and Spanish written by two experts in the field in Spain and in usa and published in the same decades; according to McEnery and Xiao (2007) our corpora meet all the criteria to be comparable. However, our methodology focused on the analysis of aspects such as content, format and style of the genre under study for the comparability of corpora will prove that proportion, genre, domain, time and size are not valid enough for comparing comparable corpora


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno