Sistema estadístico de reordenamiento de palabras en traducción automática
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/3304
Título: | Sistema estadístico de reordenamiento de palabras en traducción automática |
---|---|
Autor/es: | Ruiz Costa-Jussà, Marta | Rodríguez Fonollosa, José Adrián |
Palabras clave: | Traducción estadística | Reordenamiento | Tuplas | Statistical machine translation | Reordering | Tuples |
Fecha de publicación: | sep-2006 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | RUIZ COSTA-JUSSÀ, Marta; RODRÍGUEZ FONOLLOSA, José Adrián. "Sistema estadístico de reordenamiento de palabras en traducción automática". Procesamiento del lenguaje natural. N. 37 (sept. 2006). ISSN 1135-5948, pp. 249-255 |
Resumen: | Actualmente los errores debidos al cambio de orden de las palabras son una de las principales fuentes de error en los sistemas de traducción automática estocástica (TAE) basados en frases. Esta comunicación propone una nueva estrategia estadística para afrontar los reordenamientos que denominaremos RAE (Reordenamiento automático estocástico). El método propuesto aprovecha la poderosas técnicas de aprendizaje estadístico desarrolladas en traducción estadística para traducir el lenguaje fuente (S) en un lenguaje fuente reordenado (S’), que nos permita mejorar la traducción final al lenguaje destino (T). Por lo tanto, el lenguaje fuente de la tarea de traducción en sí pasa a ser S’, y esto nos permite generar un alineado más monótono entre las palabras de ambos lenguajes y unas unidades de traducción menores. Además, el uso de clases de palabras en la estrategia RAE ayuda a generalizar reordenamientos. En este artículo se presentan resultados en la tarea de ZhEn de la evaluación IWSLT05 que muestran una mejora significativa en la calidad de la traducción. | Nowadays, reordering is one of the most important problems in Statistical Machine Translation (SMT) systems. This paper exposes a novel strategy to face it: Statistical Machine Reordering (SMR). It consists of using the powerful techniques developed for Statistical Machine Translation (SMT) in order to translate the source language (S) into a reordered source language (S’), which allows for an improved translation into the target language (T). Then, the SMT task changes from S2T to S’2T which leads to a monotonized word alignment and shorter translation units. In addition, the use of classes in SMR helps to generalize word reorderings. Experiments are reported in the ZhEn IWSLT05 task showing significant improvement in translation quality. |
Patrocinador/es: | Este trabajo ha sido parcialmente subvencionado por el gobierno español (beca FPU), y la Unión Europea, FP6-506738 (proyecto TCSTAR). |
URI: | http://hdl.handle.net/10045/3304 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 37 (septiembre 2006) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_37_31.pdf | 198,55 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.