Ayuda
Ir al contenido

Dialnet


El "Coruña Corpus". Proceso de compilación y utilidades del "Corpus of English Texts on Astronomy (CETA)": resultados preliminares sobre el uso de predicados complejos en CETA

  • Autores: Inés Lareo Martín
  • Localización: A survey of corpus-based research / coord. por Pascual Cantos Gómez, Aquilino Sánchez Pérez, 2009, ISBN 978-84-692-2198-3, págs. 267-280
  • Idioma: español
  • Enlaces
  • Resumen
    • El grupo de investigación "Group for Multidimensional Corpus-Based Studies in English" que está desarrollando el proyecto del Coruña Corpus tiene como meta la compilación y explotación de un corpus de textos científico-técnicos ingleses publicados entre 1700 y 1900 (Coruña Corpus (CC)). Como primer paso, hemos concentrado nuestro esfuerzo en rematar el primer sub-corpus que formará parte del CC, el "Corpus of English Texts on Astronomy" (CETA), para poder presentarlo en 2009, como una contribución más a la conmemoración del año internacional de la Astronomía.

      Nuestro objetivo es ofrecer un corpus que incluirá 8 disciplinas o ramas científicas con un total de unos 4 millones de palabras, además de una herramienta de trabajo (Coruña Corpus Tool, CCT) que permitirán el análisis del lenguaje científico desde varios puntos de vista, sintáctico, semántico, léxico, morfológico, etc., centrándose en la evolución histórica de los aspectos objeto de estudio.

      Para la presentación de nuestro primer sub-corpus, CETA, comenzaremos explicando brevemente los criterios de compilación que se están siguiendo en este proyecto, relativos a la selección de disciplinas, muestras, autores, número de palabras de cada muestra y así como los criterios extralingüísticos que deben cumplir los autores seleccionados.

      Para la presentación de la herramienta de búsqueda desarrollada para la explotación del Coruña Corpus en colaboración con el grupo IRLAB, perteneciente a la misma Universidad, explicaremos las funciones de búsqueda centrándonos en un estudio concreto.

      Ofreceremos los resultados preliminares del análisis de Predicados Complejos (PCs) en el sentido de Cattell (1984), es decir, aquellos PCs que tengan un verbo homógrafo o etimológicamente relacionado, como por ejemplo: make a promise-to promise.

      Mostraremos con más detalle una de las secciones de la CCT que aporta, a nuestro entender, información muy valiosa para los estudios lingüísticos. Esta sección, a la que denominamos metadatos, contiene toda la información extralingüística relevante para la investigación tanto sobre el autor como sobre el propio texto.


Fundación Dialnet

Dialnet Plus

  • Más información sobre Dialnet Plus

Opciones de compartir

Opciones de entorno