Using collocation segmentation to extract translation units in a phrase-based statistical machine translation system
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/14717
Título: | Using collocation segmentation to extract translation units in a phrase-based statistical machine translation system |
---|---|
Título alternativo: | Implementación de una segmentación estadística complementaria para extraer unidades de traducción en un sistema de traducción estadístico basado en frases |
Autor/es: | Ruiz Costa-Jussà, Marta | Daudaravicius, Vidas | Banchs Martínez, Rafael Enrique |
Palabras clave: | Traducción automática | Segmentación | Machine translation | Collocation segmentation |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | oct-2010 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | RUIZ COSTA-JUSSÀ, Marta; DAUDARAVICIUS, Vidas; BANCHS MARTÍNEZ, Rafael Enrique. “Using collocation segmentation to extract translation units in a phrase-based statistical machine translation system”. Procesamiento del Lenguaje Natural. N. 45 (2010). ISSN 1135-5948 |
Resumen: | Este artículo evalúa un nuevo método de segmentación en un sistema de traducción automática estadístico basado en frases. La técnica de segmentación se implementa tanto en la parte fuente como en la parte destino y se usa para extraer unidades de traducción. Los resultados mejoran el sistema de referencia en la tarea español-inglés del EuroParl. | This report evaluates the impact of using a novel collocation segmentation method for phrase extraction in the standard phrase-based statistical machine translation approach. The collocation segmentation technique is implemented simultaneously in the source and target side. The resulting collocation segmentation is used to extract translation units. Experiments are reported in the Spanish-to-English EuroParl task and promising results are achieved in translation quality. |
Patrocinador/es: | This work has been partially funded by the Spanish Department of Education and Science through the Juan de la Cierva fellowship program. The authors also wants to thank the Barcelona Media Innovation Centre for its support and permission to publish this research. |
URI: | http://hdl.handle.net/10045/14717 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Revisión científica: | si |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 45 (2010) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_45_16.pdf | 262,08 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.