Tampere, Finlandia
La necesidad de utilizar corpora del discurso interpretativo está aumentando gradualmente en losestudios de traducción. La razón principal de la escasez de este tipo de recursos es la dificultad deobtener los datos y la inevitabilidad de introducir los datos manualmente. Un corpus de interpretaciónes una colección de transcripciones del habla en dos o más lenguas alineadas. La estructura del corpusdebe reflejar la naturaleza polifónica de los datos. Por eso, el marcado es extremadamente importanteen este tipo de corpus. La investigación presentada en este artículo trata de un corpus del discursointerpretativo finlandés-ruso. El paquete de software desarrollado para el procesamiento del corpusincluye los procedimientos específicamente desarrollados para los estudios de transcripciones del habla,y no del lenguaje escrito. Por ejemplo, la función que calcula las estadísticas del hablante obtiene elnúmero de palabras, el número de pausas, su duración y el promedio de la velocidad del habla de unhablante.
The need for corpora of interpreting discourse in translation studies is gradually increasing. The mainreason of the lack in such resources is the difficulty of obtaining data and the inevitability of manual datainput. An interpreting corpus would be a collection of transcripts of speech in two or more languageswith part of the transcripts aligned. The structure of the corpus should reflect the polyphonic nature ofthe data. Thus, markup becomes extremely important in this type of corpora. The research presented inthis paper deals with corpora of Finnish-Russian interpreting discourse. The software packagedeveloped for processing of the corpora includes routines specially written for studying speechtranscripts rather than written text. For example, speaker statistics function calculates number of words,number of pauses, their duration, average speech tempo of a certain speaker
© 2001-2025 Fundación Dialnet · Todos los derechos reservados