Turquía
En el presente trabajo se examina el debate en curso sobre adquirir representatividad en corpusgenerales de lengua hablada con el objetivo de proponer un modelo para el diseño y trabajo deconstrucción de corpus orales. La propuesta está enmarcada dentro de un trabajo en curso que seencuentra en su fase inicial, la lengua implementación del Spoken Turkish Corpus, un corpus queconstará con un millón de palabras de la lengua turca actual hablada en Turquía. Este trabajo proponeun método de trabajo cíclico y un esquema de diseño basado en unos criterios fundados en un conjuntode tres características, a saber, demográficas, contextuales y discursivas, pueden estar perfectamentecombinadas para observar y conseguir representatividad. Este trabajo trata de los principiossubyacentes en el esquema de diseño y esboza los rasgos de los metadatos del sistema de gestión decorpus basado en la web, que utilizan y complementan las herramientas EXMARaLDA (Schmidt, 2004)en la construcción y seguimiento del corpus
In this paper we overview the ongoing debate on achieving representativeness in general spoken corporawith the purpose of proposing a model for spoken corpora design and construction workflows. Theproposal is illustrated in the context of an ongoing implementation for the Spoken Turkish Corpus, acorpus that will consist of one million words of present-day Turkish spoken in Turkey in its initial stage.The paper proposes a cyclic workflow and design scheme that is based on the principles of an “agile”corpus design and annotation system (Voorman and Gut, 2008), and argues that a three-pronged set offeature criteria, namely, demographic, contextual, and discursive features can be fruitfully combined tomonitor and achieve representativeness. The paper discusses the underlying principles in the designscheme and outlines the metadata features of the web-based corpus management system, which utilizesand complements EXMARaLDA tools (Schmidt, 2004) in corpus construction and monitoring.
© 2001-2024 Fundación Dialnet · Todos los derechos reservados