Modelo estocástico de traducción basado en N-gramas de tuplas bilingües y combinación log-lineal de características

Mariño Acebal, José Bernardo; Banchs Martínez, Rafael Enrique; Crego Clemente, Josep María; Gispert Ramis, Adrià de; Lambert, Patrik; Rodríguez Fonollosa, José Adrián; Ruiz Costa-Jussà, Marta

Modelo estocástico de traducción basado en N-gramas de tuplas bilingües y combinación log-lineal de características

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1297

Información del item - Informació de l'item - Item information
Título:	Modelo estocástico de traducción basado en N-gramas de tuplas bilingües y combinación log-lineal de características
Autor/es:	Mariño Acebal, José Bernardo \| Banchs Martínez, Rafael Enrique \| Crego Clemente, Josep María \| Gispert Ramis, Adrià de \| Lambert, Patrik \| Rodríguez Fonollosa, José Adrián \| Ruiz Costa-Jussà, Marta
Palabras clave:	Traducción automática del habla \| Traducción estocástica \| N-gramas \| Modelo de lenguaje de entropía máxima \| Stochastic machine translation \| Speech-to-speech translation \| N-gram model \| Maximum entropy language modelling
Fecha de publicación:	sep-2005
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	MARIÑO ACEBAL, José Bernardo, et al. “Modelo estocástico de traducción basado en N-gramas de tuplas bilingües y combinación log-lineal de características”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 69-76
Resumen:	En esta comunicación se presenta un sistema de traducción estocástica basado en el modelado mediante N-gramas de la probabilidad conjunta de textos bilingües. La unidad básica del modelo es la tupla, par de cadenas de palabras del lenguaje fuente (a traducir) y el lenguaje destino (traducción). La traducción se lleva a cabo mediante la maximización de una combinación lineal de los logaritmos de la probabilidad asignada a la traducción por el modelo de traducción y otras características, siguiendo la aproximación de entropía máxima. Las prestaciones del sistema de traducción son evaluadas con una tarea de traducción del habla: la traducción entre inglés y español (y viceversa) de transcripciones de intervenciones de los miembros del Parlamento Europeo. Los resultados alcanzados se encuentran al nivel del estado del arte. \| This communication introduces a stochastic machine translation system based on Ngram modelling of the joint probability of bilingual texts. The basic unit of this model is called a tuple and consists of a pair of both source (to be translated) language and target language (translation) word-strings. Translation is driven by a log-linear combination of the N-gram model probability and other features, according to the maximum entropy language modelling approach. The translation performance is evaluated by means of a speech-to-speech translation tasks: translation from Spanish to English (and viceversa) of European Parliament speeches. The system reaches a state-of-art performance.
Patrocinador/es:	Este trabajo ha sido financiado parcialmente por la CICYT a través del proyecto TIC2002-04447-C02 (ALIADO) y la Unión Europea mediante el proyecto FP6-506738 (TC-STAR).
URI:	http://hdl.handle.net/10045/1297
ISSN:	1135-5948
Idioma:	spa
Tipo:	info:eu-repo/semantics/article
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_35_09.pdf		266,3 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo