Using collocation segmentation to extract translation units in a phrase-based statistical machine translation system

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/14717
Información del item - Informació de l'item - Item information
Título: Using collocation segmentation to extract translation units in a phrase-based statistical machine translation system
Título alternativo: Implementación de una segmentación estadística complementaria para extraer unidades de traducción en un sistema de traducción estadístico basado en frases
Autor/es: Ruiz Costa-Jussà, Marta | Daudaravicius, Vidas | Banchs Martínez, Rafael Enrique
Palabras clave: Traducción automática | Segmentación | Machine translation | Collocation segmentation
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: oct-2010
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: RUIZ COSTA-JUSSÀ, Marta; DAUDARAVICIUS, Vidas; BANCHS MARTÍNEZ, Rafael Enrique. “Using collocation segmentation to extract translation units in a phrase-based statistical machine translation system”. Procesamiento del Lenguaje Natural. N. 45 (2010). ISSN 1135-5948
Resumen: Este artículo evalúa un nuevo método de segmentación en un sistema de traducción automática estadístico basado en frases. La técnica de segmentación se implementa tanto en la parte fuente como en la parte destino y se usa para extraer unidades de traducción. Los resultados mejoran el sistema de referencia en la tarea español-inglés del EuroParl. | This report evaluates the impact of using a novel collocation segmentation method for phrase extraction in the standard phrase-based statistical machine translation approach. The collocation segmentation technique is implemented simultaneously in the source and target side. The resulting collocation segmentation is used to extract translation units. Experiments are reported in the Spanish-to-English EuroParl task and promising results are achieved in translation quality.
Patrocinador/es: This work has been partially funded by the Spanish Department of Education and Science through the Juan de la Cierva fellowship program. The authors also wants to thank the Barcelona Media Innovation Centre for its support and permission to publish this research.
URI: http://hdl.handle.net/10045/14717
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 45 (2010)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_45_16.pdf262,08 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.