Sentence selection for improving the tuning process of a statistical machine translation system

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/22030
Full metadata record
Full metadata record
DC FieldValueLanguage
dc.contributor.authorLópez Ludeña, Verónica-
dc.contributor.authorSan Segundo Hernández, Rubén-
dc.contributor.authorMontero Martínez, Juan Manuel-
dc.contributor.authorLorenzo Trueba, Jaime-
dc.date.accessioned2012-04-25T11:43:09Z-
dc.date.available2012-04-25T11:43:09Z-
dc.date.issued2012-03-
dc.identifier.citationLÓPEZ-LUDEÑA, Verónica, et al. “Sentence selection for improving the tuning process of a statistical machine translation system”. Procesamiento del Lenguaje Natural. N. 48 (2012). ISSN 1135-5948, pp. 51-56es
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/22030-
dc.description.abstractEste artículo describe una estrategia de selección de frases para hacer el ajuste de un sistema de traducción estadístico basado en el decodificador Moses que traduce del español al inglés. En este trabajo proponemos dos posibilidades para realizar esta selección de las frases del corpus de validación que más se parecen a las frases que queremos traducir (frases de test en lengua origen). Con esta selección podemos obtener unos mejores pesos de los modelos para emplearlos después en el proceso de traducción y, por tanto, mejorar los resultados. Concretamente, con el método de selección basado en la medida de similitud propuesta en este artículo, mejoramos la medida BLEU del 27,17% con el corpus de validación completo al 27,27% seleccionando las frases para el ajuste. Estos resultados se acercan a los del experimento ORACLE: se utilizan las mismas frases de test para hacer el ajuste de los pesos. En este caso, el BLEU obtenido es de 27,51%.es
dc.description.abstractThis paper describes a sentence selection strategy for tuning a statistical machine translation system based on Moses that translates Spanish into English. This work proposes two techniques that allow selecting the more similar source sentences of the development corpus to the sentences to translate (source test sentences). With this selection, better model weights are obtained to be used later in the translation process and therefore, to obtain better translation results. In particular, with the similarity selection method proposed in this paper, experiments report a BLEU improvement from 27.17%, with the complete development set, to 27.27% BLEU, selecting the sentences for tuning. This result is closer to the result obtained for the ORACLE experiment: BLEU of 27.51%. The ORACLE experiment consists of using the same test set for tuning the system weights.es
dc.description.sponsorshipThe work leading to these results has received funding from the European Union under grant agreement n° 287678. It has also been supported by some domestic projects: TIMPANO (TIN2011-28169-C05-03), ITALIHA (CAM-UPM), INAPRA (MICINN, DPI2010-21247-C02-02), SD-TEAM (MEC, TIN2008-06856-C05-03) and MA2VICMR (Comunidad Autónoma de Madrid, S2009/TIC-1542) projects.es
dc.languageenges
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturales
dc.subjectTraducción estadísticaes
dc.subjectSelección de corpuses
dc.subjectTraducción basada en subfraseses
dc.subjectTraducción español-ingléses
dc.subjectAjuste de pesoses
dc.subjectStatistical machine translationes
dc.subjectCorpus selectiones
dc.subjectPhrase-based translationes
dc.subjectSpanish into English translationes
dc.subjectWeight tuninges
dc.subject.otherLenguajes y Sistemas Informáticoses
dc.titleSentence selection for improving the tuning process of a statistical machine translation systemes
dc.title.alternativeSelección de frases para la mejora del proceso de ajuste de un sistema de traducción estadísticaes
dc.typeinfo:eu-repo/semantics/articlees
dc.peerreviewedsies
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
Appears in Collections:Revistas - Procesamiento del Lenguaje Natural - Nº 48 (2012)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_48_06.pdf677,62 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.