Cross-lingual Diachronic Distance: Application to Portuguese and Spanish

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/96598
Información del item - Informació de l'item - Item information
Título: Cross-lingual Diachronic Distance: Application to Portuguese and Spanish
Título alternativo: Distancia diacrónica interlingüística: aplicación al portugués y el castellano
Autor/es: Pichel Campos, José Ramom | Gamallo Otero, Pablo | Alegría Loinaz, Iñaki
Palabras clave: Corpus linguistics | Historical Linguistics | Language distance | Development of linguistic resources and tools | Lingüística de Corpus | Lingüística Histórica | Distancia entre Lenguas | Desarrollo de recursos lingüísticos y herramientas
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2019
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2019, 63: 77-84. doi:10.26342/2019-63-8
Resumen: The aim of this paper is to establish a corpus-based methodology for automatically measuring the cross-lingual distance between historical periods of two languages using perplexity. The corpus of both has been constructed adhoc with the closest spelling to the original representing chronologically and in a balanced way fiction and non-fiction. The methodology has been applied to two related languages, Portuguese and Spanish, and measured their diachronic distances both in original orthography and in an automatically transcribed spelling. | El objetivo de este trabajo es establecer una metodología basada en corpus para medir automáticamente la distancia interlingüística entre períodos históricos de dos lenguas mediante perplexity. El corpus de los dos idiomas ha sido construido adhoc con ortografía lo más próxima a la original representando cronológicamente y de forma balanceada ficción y no ficción. Se ha aplicado la metodología a dos lenguas relacionadas, Portugués y Español, y medido sus distancias diacrónicas tanto en ortografía original como en una ortografía transcrita automáticamente.
Patrocinador/es: This work has received financial support from the DOMINO project (PGC2018-102041-B-I00, MCIU/AEI/FEDER, UE), and the Consellería de Cultura, Educación e Ordenación Universitaria (accreditation 2016-2019, ED431G/08) and the European Regional Development Fund (ERDF).
URI: http://hdl.handle.net/10045/96598
ISSN: 1135-5948
DOI: 10.26342/2019-63-8
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2019-63-8
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 63 (2019)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_63_08.pdf927,8 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.