Sentence selection for improving the tuning process of a statistical machine translation system
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/22030
Registro completo de metadatos
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.author | López Ludeña, Verónica | - |
dc.contributor.author | San Segundo Hernández, Rubén | - |
dc.contributor.author | Montero Martínez, Juan Manuel | - |
dc.contributor.author | Lorenzo Trueba, Jaime | - |
dc.date.accessioned | 2012-04-25T11:43:09Z | - |
dc.date.available | 2012-04-25T11:43:09Z | - |
dc.date.issued | 2012-03 | - |
dc.identifier.citation | LÓPEZ-LUDEÑA, Verónica, et al. “Sentence selection for improving the tuning process of a statistical machine translation system”. Procesamiento del Lenguaje Natural. N. 48 (2012). ISSN 1135-5948, pp. 51-56 | es |
dc.identifier.issn | 1135-5948 | - |
dc.identifier.uri | http://hdl.handle.net/10045/22030 | - |
dc.description.abstract | Este artículo describe una estrategia de selección de frases para hacer el ajuste de un sistema de traducción estadístico basado en el decodificador Moses que traduce del español al inglés. En este trabajo proponemos dos posibilidades para realizar esta selección de las frases del corpus de validación que más se parecen a las frases que queremos traducir (frases de test en lengua origen). Con esta selección podemos obtener unos mejores pesos de los modelos para emplearlos después en el proceso de traducción y, por tanto, mejorar los resultados. Concretamente, con el método de selección basado en la medida de similitud propuesta en este artículo, mejoramos la medida BLEU del 27,17% con el corpus de validación completo al 27,27% seleccionando las frases para el ajuste. Estos resultados se acercan a los del experimento ORACLE: se utilizan las mismas frases de test para hacer el ajuste de los pesos. En este caso, el BLEU obtenido es de 27,51%. | es |
dc.description.abstract | This paper describes a sentence selection strategy for tuning a statistical machine translation system based on Moses that translates Spanish into English. This work proposes two techniques that allow selecting the more similar source sentences of the development corpus to the sentences to translate (source test sentences). With this selection, better model weights are obtained to be used later in the translation process and therefore, to obtain better translation results. In particular, with the similarity selection method proposed in this paper, experiments report a BLEU improvement from 27.17%, with the complete development set, to 27.27% BLEU, selecting the sentences for tuning. This result is closer to the result obtained for the ORACLE experiment: BLEU of 27.51%. The ORACLE experiment consists of using the same test set for tuning the system weights. | es |
dc.description.sponsorship | The work leading to these results has received funding from the European Union under grant agreement n° 287678. It has also been supported by some domestic projects: TIMPANO (TIN2011-28169-C05-03), ITALIHA (CAM-UPM), INAPRA (MICINN, DPI2010-21247-C02-02), SD-TEAM (MEC, TIN2008-06856-C05-03) and MA2VICMR (Comunidad Autónoma de Madrid, S2009/TIC-1542) projects. | es |
dc.language | eng | es |
dc.publisher | Sociedad Española para el Procesamiento del Lenguaje Natural | es |
dc.subject | Traducción estadística | es |
dc.subject | Selección de corpus | es |
dc.subject | Traducción basada en subfrases | es |
dc.subject | Traducción español-inglés | es |
dc.subject | Ajuste de pesos | es |
dc.subject | Statistical machine translation | es |
dc.subject | Corpus selection | es |
dc.subject | Phrase-based translation | es |
dc.subject | Spanish into English translation | es |
dc.subject | Weight tuning | es |
dc.subject.other | Lenguajes y Sistemas Informáticos | es |
dc.title | Sentence selection for improving the tuning process of a statistical machine translation system | es |
dc.title.alternative | Selección de frases para la mejora del proceso de ajuste de un sistema de traducción estadística | es |
dc.type | info:eu-repo/semantics/article | es |
dc.peerreviewed | si | es |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | es |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 48 (2012) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_48_06.pdf | 677,62 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.