Construcción del RomCro: un corpus paralelo multilingüe

Autores: Bojana Mikelenić, Metka Bezlaj, Gorana Bikic-Caric
Localización: Procesamiento del lenguaje natural, ISSN 1135-5948, Nº. 70, 2023, págs. 99-110
Idioma: español
Títulos paralelos:
- Construction of RomCro: a multilingual parallel corpus
Enlaces
- Texto completo
Resumen
- español
  En este trabajo se presentan las fases de construcción de un corpus paralelo multilingüe de cinco lenguas romances y croata. El corpus contiene oraciones originales provenientes de textos literarios de los siglos XX y XXI, alineadas con sus traducciones al resto de los idiomas. El orden original de las oraciones ha sido cambiado. El corpus cuenta con 15,9 millones de palabras y está disponible en las plataformas Sketch Engine y ELRC.
- English
  In this article we present the phases of construction of a parallel multilingual corpus of five Romance languages and Croatian. The corpus contains original sentences from literary texts from the 20th and 21st centuries, aligned with their translational equivalents in remaining languages. The original order of sentences is scrambled. The corpus counts with 15.9 million words and is available on platforms Sketch Engine and ELRC.

Acceso de usuarios registrados

¿Es nuevo? Regístrese

Coordinado por: