Sistema estadístico de reordenamiento de palabras en traducción automática

Ruiz Costa-Jussà, Marta; Rodríguez Fonollosa, José Adrián

Sistema estadístico de reordenamiento de palabras en traducción automática

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/3304

Información del item - Informació de l'item - Item information
Título:	Sistema estadístico de reordenamiento de palabras en traducción automática
Autor/es:	Ruiz Costa-Jussà, Marta \| Rodríguez Fonollosa, José Adrián
Palabras clave:	Traducción estadística \| Reordenamiento \| Tuplas \| Statistical machine translation \| Reordering \| Tuples
Fecha de publicación:	sep-2006
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	RUIZ COSTA-JUSSÀ, Marta; RODRÍGUEZ FONOLLOSA, José Adrián. "Sistema estadístico de reordenamiento de palabras en traducción automática". Procesamiento del lenguaje natural. N. 37 (sept. 2006). ISSN 1135-5948, pp. 249-255
Resumen:	Actualmente los errores debidos al cambio de orden de las palabras son una de las principales fuentes de error en los sistemas de traducción automática estocástica (TAE) basados en frases. Esta comunicación propone una nueva estrategia estadística para afrontar los reordenamientos que denominaremos RAE (Reordenamiento automático estocástico). El método propuesto aprovecha la poderosas técnicas de aprendizaje estadístico desarrolladas en traducción estadística para traducir el lenguaje fuente (S) en un lenguaje fuente reordenado (S’), que nos permita mejorar la traducción final al lenguaje destino (T). Por lo tanto, el lenguaje fuente de la tarea de traducción en sí pasa a ser S’, y esto nos permite generar un alineado más monótono entre las palabras de ambos lenguajes y unas unidades de traducción menores. Además, el uso de clases de palabras en la estrategia RAE ayuda a generalizar reordenamientos. En este artículo se presentan resultados en la tarea de ZhEn de la evaluación IWSLT05 que muestran una mejora significativa en la calidad de la traducción. \| Nowadays, reordering is one of the most important problems in Statistical Machine Translation (SMT) systems. This paper exposes a novel strategy to face it: Statistical Machine Reordering (SMR). It consists of using the powerful techniques developed for Statistical Machine Translation (SMT) in order to translate the source language (S) into a reordered source language (S’), which allows for an improved translation into the target language (T). Then, the SMT task changes from S2T to S’2T which leads to a monotonized word alignment and shorter translation units. In addition, the use of classes in SMR helps to generalize word reorderings. Experiments are reported in the ZhEn IWSLT05 task showing significant improvement in translation quality.
Patrocinador/es:	Este trabajo ha sido parcialmente subvencionado por el gobierno español (beca FPU), y la Unión Europea, FP6-506738 (proyecto TCSTAR).
URI:	http://hdl.handle.net/10045/3304
ISSN:	1135-5948
Idioma:	spa
Tipo:	info:eu-repo/semantics/article
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 37 (septiembre 2006)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_37_31.pdf		198,55 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo