Cross-lingual Diachronic Distance: Application to Portuguese and Spanish

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/96598
Información del item - Informació de l'item - Item information
Títol: Cross-lingual Diachronic Distance: Application to Portuguese and Spanish
Títol alternatiu: Distancia diacrónica interlingüística: aplicación al portugués y el castellano
Autors: Pichel Campos, José Ramom | Gamallo Otero, Pablo | Alegría Loinaz, Iñaki
Paraules clau: Corpus linguistics | Historical Linguistics | Language distance | Development of linguistic resources and tools | Lingüística de Corpus | Lingüística Histórica | Distancia entre Lenguas | Desarrollo de recursos lingüísticos y herramientas
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: de setembre-2019
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: Procesamiento del Lenguaje Natural. 2019, 63: 77-84. doi:10.26342/2019-63-8
Resum: The aim of this paper is to establish a corpus-based methodology for automatically measuring the cross-lingual distance between historical periods of two languages using perplexity. The corpus of both has been constructed adhoc with the closest spelling to the original representing chronologically and in a balanced way fiction and non-fiction. The methodology has been applied to two related languages, Portuguese and Spanish, and measured their diachronic distances both in original orthography and in an automatically transcribed spelling. | El objetivo de este trabajo es establecer una metodología basada en corpus para medir automáticamente la distancia interlingüística entre períodos históricos de dos lenguas mediante perplexity. El corpus de los dos idiomas ha sido construido adhoc con ortografía lo más próxima a la original representando cronológicamente y de forma balanceada ficción y no ficción. Se ha aplicado la metodología a dos lenguas relacionadas, Portugués y Español, y medido sus distancias diacrónicas tanto en ortografía original como en una ortografía transcrita automáticamente.
Patrocinadors: This work has received financial support from the DOMINO project (PGC2018-102041-B-I00, MCIU/AEI/FEDER, UE), and the Consellería de Cultura, Educación e Ordenación Universitaria (accreditation 2016-2019, ED431G/08) and the European Regional Development Fund (ERDF).
URI: http://hdl.handle.net/10045/96598
ISSN: 1135-5948
DOI: 10.26342/2019-63-8
Idioma: eng
Tipus: info:eu-repo/semantics/article
Drets: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisió científica: si
Versió de l'editor: https://doi.org/10.26342/2019-63-8
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 63 (2019)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_63_08.pdf927,8 kBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.