A Bidirectional Recurrent Neural Language Model for Machine Translation

Peris, Álvaro; Casacuberta Nolla, Francisco

A Bidirectional Recurrent Neural Language Model for Machine Translation

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/49282

Información del item - Informació de l'item - Item information
Títol:	A Bidirectional Recurrent Neural Language Model for Machine Translation
Títol alternatiu:	Un modelo de lenguaje neuronal recurrente bidireccional para la traducción automática
Autors:	Peris, Álvaro \| Casacuberta Nolla, Francisco
Paraules clau:	Language modelling \| Bidirectional recurrent neural networks \| Instance selection \| Statistical machine translation \| Modelado de lenguaje \| Redes neuronales recurrentes bidireccionales \| Selección de datos \| Traducción automática estadística
Àrees de coneixement:	Lenguajes y Sistemas Informáticos
Data de publicació:	de setembre-2015
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica:	Procesamiento del Lenguaje Natural. 2015, 55: 109-116
Resum:	A language model based in continuous representations of words is presented, which has been applied to a statistical machine translation task. This model is implemented by means of a bidirectional recurrent neural network, which is able to take into account both the past and the future context of a word in order to perform predictions. Due to its high temporal cost at training time, for obtaining relevant training data an instance selection algorithm is used, which aims to capture useful information for translating a test set. Obtained results show that the neural model trained with the selected data outperforms the results obtained by an n-gram language model. \| Se presenta un modelo de lenguaje basado en representaciones continuas de las palabras, el cual se ha aplicado a una tarea de traducción automática estadística. Este modelo está implementado por una red neuronal recurrente bidireccional, la cual es capaz de tener en cuenta el contexto pasado y futuro de una palabra para realizar predicciones. Debido su alto coste temporal de entrenamiento, para obtener datos de entrenamiento relevantes se emplea un algoritmo de selección de oraciones, el cual busca capturar información útil para traducir un determinado conjunto de test. Los resultados obtenidos muestran que el modelo neuronal entrenado con los datos seleccionados es capaz de mejorar los resultados obtenidos por un modelo de lenguaje de n-gramas.
Patrocinadors:	The research leading to these results has received funding from the Generalitat Valenciana under grant Prometeo/2009/014.
URI:	http://hdl.handle.net/10045/49282
ISSN:	1135-5948
Idioma:	eng
Tipus:	info:eu-repo/semantics/article
Drets:	© Sociedad Española para el Procesamiento del Lenguaje Natural
Revisió científica:	si
Versió de l'editor:	http://journal.sepln.org/sepln/ojs/ojs/index.php/pln
Apareix a la col·lecció:	Procesamiento del Lenguaje Natural - Nº 55 (2015)

Arxius per aquest ítem:

Arxius per aquest ítem:
Arxiu	Descripció	Tamany	Format
PLN_55_12.pdf		753,48 kB	Adobe PDF	Obrir Vista prèvia Tancar vista prèvia

Veure citacions a Google Académic

Mostrar el registre complet de l'ítem

Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.