El grupo de investigación "Group for Multidimensional Corpus-Based Studies in English" que está desarrollando el proyecto del Coruña Corpus tiene como meta la compilación y explotación de un corpus de textos científico-técnicos ingleses publicados entre 1700 y 1900 (Coruña Corpus (CC)). Como primer paso, hemos concentrado nuestro esfuerzo en rematar el primer sub-corpus que formará parte del CC, el "Corpus of English Texts on Astronomy" (CETA), para poder presentarlo en 2009, como una contribución más a la conmemoración del año internacional de la Astronomía.
Nuestro objetivo es ofrecer un corpus que incluirá 8 disciplinas o ramas científicas con un total de unos 4 millones de palabras, además de una herramienta de trabajo (Coruña Corpus Tool, CCT) que permitirán el análisis del lenguaje científico desde varios puntos de vista, sintáctico, semántico, léxico, morfológico, etc., centrándose en la evolución histórica de los aspectos objeto de estudio.
Para la presentación de nuestro primer sub-corpus, CETA, comenzaremos explicando brevemente los criterios de compilación que se están siguiendo en este proyecto, relativos a la selección de disciplinas, muestras, autores, número de palabras de cada muestra y así como los criterios extralingüísticos que deben cumplir los autores seleccionados.
Para la presentación de la herramienta de búsqueda desarrollada para la explotación del Coruña Corpus en colaboración con el grupo IRLAB, perteneciente a la misma Universidad, explicaremos las funciones de búsqueda centrándonos en un estudio concreto.
Ofreceremos los resultados preliminares del análisis de Predicados Complejos (PCs) en el sentido de Cattell (1984), es decir, aquellos PCs que tengan un verbo homógrafo o etimológicamente relacionado, como por ejemplo: make a promise-to promise.
Mostraremos con más detalle una de las secciones de la CCT que aporta, a nuestro entender, información muy valiosa para los estudios lingüísticos. Esta sección, a la que denominamos metadatos, contiene toda la información extralingüística relevante para la investigación tanto sobre el autor como sobre el propio texto.
© 2001-2025 Fundación Dialnet · Todos los derechos reservados