Uso de información morfológica en el alineamiento español-euskera

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/3305
Información del item - Informació de l'item - Item information
Título: Uso de información morfológica en el alineamiento español-euskera
Autor/es: Agirre Bengoa, Eneko | Díaz de Ilarraza Sánchez, Arantza | Labaka Intxauspe, Gorka | Sarasola Gabiola, Kepa
Palabras clave: Traducción automática | Alineamiento | Idiomas aglutinantes | Machine translation | Alignment | Agglutinative languages
Fecha de publicación: sep-2006
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: AGIRRE BENGOA, Eneko, et al. "Uso de información morfológica en el alineamiento español-euskera". Procesamiento del lenguaje natural. N. 37 (sept. 2006). ISSN 1135-5948, pp. 257-264
Resumen: En este artículo presentamos un primer estudio para el alineamiento de un corpus español-euskera mediante un alineador token-a-token en el que se consideran diferentes opciones de preprocesamiento morfológico. Usando GIZA++ conseguimos una reducción del error (Alignment Error Rate) de un 12.48% respecto el baseline (carente de preproceso alguno), llegando al 23.76%. Este resultado es comparable al obtenido para otros idiomas aglutinantes como el euskera. | In this paper we present a preliminary study for the alignment of a Spanish-Basque parallel corpus using a token-based aligner (GIZA++).We have studied several morphological pre-processing alternatives, and achieved 23.76% Alignment Error Rate, with a reduction of 12.48% over the baseline (no pre-processing). The results are comparable to those obtained for others agglutinative languages.
URI: http://hdl.handle.net/10045/3305
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 37 (septiembre 2006)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_37_32.pdf133,2 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.