Agirre Bengoa, Eneko, Díaz de Ilarraza Sánchez, Arantza, Labaka Intxauspe, Gorka, Sarasola Gabiola, Kepa
Uso de información morfológica en el alineamiento español-euskera
AGIRRE BENGOA, Eneko, et al. "Uso de información morfológica en el alineamiento español-euskera". Procesamiento del lenguaje natural. N. 37 (sept. 2006). ISSN 1135-5948, pp. 257-264
URI: http://hdl.handle.net/10045/3305
DOI: 
ISSN: 1135-5948
Abstract: 
En este artículo presentamos un primer estudio para el alineamiento de
un corpus español-euskera mediante un alineador token-a-token en el que se consideran
diferentes opciones de preprocesamiento morfológico. Usando GIZA++ conseguimos
una reducción del error (Alignment Error Rate) de un 12.48% respecto
el baseline (carente de preproceso alguno), llegando al 23.76%. Este resultado es
comparable al obtenido para otros idiomas aglutinantes como el euskera.
In this paper we present a preliminary study for the alignment of a
Spanish-Basque parallel corpus using a token-based aligner (GIZA++).We have studied
several morphological pre-processing alternatives, and achieved 23.76% Alignment
Error Rate, with a reduction of 12.48% over the baseline (no pre-processing).
The results are comparable to those obtained for others agglutinative languages.
Keywords:Traducción automática, Alineamiento, Idiomas aglutinantes, Machine translation, Alignment, Agglutinative languages
Sociedad Española para el Procesamiento del Lenguaje Natural
info:eu-repo/semantics/article