Algoritmo de decodificación de traducción automática estocástica basado en n-gramas
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/1299
Título: | Algoritmo de decodificación de traducción automática estocástica basado en n-gramas |
---|---|
Autor/es: | Crego Clemente, Josep María | Mariño Acebal, José Bernardo | Gispert Ramis, Adrià de |
Palabras clave: | Traducción automática estocástica | Modelos de traducción basados en N-gramas | Algoritmos de decodificación | Stochastic machine translation | N-gram-based translation models | Decoding algorithms |
Fecha de publicación: | sep-2005 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | CREGO CLEMENTE, Josep María; MARIÑO ACEBAL, José Bernardo; GISPERT RAMIS, Adrià de. “Algoritmo de decodificación de traducción automática estocástica basado en n-gramas”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 85-92 |
Resumen: | En esta comunicación se presenta MARIE, un algoritmo de decodificación para un sistema de traducción automática estocástica basado en N-gramas. Para su implementación se utiliza una estrategia de búsqueda en haz, con capacidad para realizar reordenamientos (distorsión). El modelo de traducción está basado en N-gramas bilingües, ampliado para introducir reordenamientos en las cadenas de palabras. La estructura del espacio de búsqueda permite realizar un alto grado de poda, incrementando así la eficiencia del algoritmo. | In this paper we describe MARIE, an N-gram-based stochastic machine translation decoder. It is implemented using a beam search strategy, with distortion (or reordering) capabilities. The underlying translation model is based on an N-gram approach, extended to introduce reordering at the phrase level. The search graph structure is designed to perform very accurate comparisons, what allows for a high level of pruning, improving the decoder efficiency. |
Patrocinador/es: | Esta comunicación ha sido parcialmente subvencionada por el gobierno español, TIC-2002-04447-C02 (proyecto Aliado), la Unión Europea, FP6-506738 (proyecto TC-STAR) y la Universidad Politécnica de Catalunya (beca UPC-RECERCA). |
URI: | http://hdl.handle.net/10045/1299 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_35_11.pdf | 193,03 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.