Uso de información morfológica en el alineamiento español-euskera
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10045/3305
Full metadata record
DC Field | Value | Language |
---|---|---|
dc.contributor.author | Agirre Bengoa, Eneko | - |
dc.contributor.author | Díaz de Ilarraza Sánchez, Arantza | - |
dc.contributor.author | Labaka Intxauspe, Gorka | - |
dc.contributor.author | Sarasola Gabiola, Kepa | - |
dc.date.accessioned | 2007-11-27T12:42:11Z | - |
dc.date.available | 2007-11-27T12:42:11Z | - |
dc.date.issued | 2006-09 | - |
dc.identifier.citation | AGIRRE BENGOA, Eneko, et al. "Uso de información morfológica en el alineamiento español-euskera". Procesamiento del lenguaje natural. N. 37 (sept. 2006). ISSN 1135-5948, pp. 257-264 | en |
dc.identifier.issn | 1135-5948 | - |
dc.identifier.uri | http://hdl.handle.net/10045/3305 | - |
dc.description.abstract | En este artículo presentamos un primer estudio para el alineamiento de un corpus español-euskera mediante un alineador token-a-token en el que se consideran diferentes opciones de preprocesamiento morfológico. Usando GIZA++ conseguimos una reducción del error (Alignment Error Rate) de un 12.48% respecto el baseline (carente de preproceso alguno), llegando al 23.76%. Este resultado es comparable al obtenido para otros idiomas aglutinantes como el euskera. | en |
dc.description.abstract | In this paper we present a preliminary study for the alignment of a Spanish-Basque parallel corpus using a token-based aligner (GIZA++).We have studied several morphological pre-processing alternatives, and achieved 23.76% Alignment Error Rate, with a reduction of 12.48% over the baseline (no pre-processing). The results are comparable to those obtained for others agglutinative languages. | en |
dc.language | spa | en |
dc.publisher | Sociedad Española para el Procesamiento del Lenguaje Natural | en |
dc.relation.ispartof | Procesamiento del lenguaje natural, nº 37 (sept. 2006), pp. 257-264 | en |
dc.subject | Traducción automática | en |
dc.subject | Alineamiento | en |
dc.subject | Idiomas aglutinantes | en |
dc.subject | Machine translation | en |
dc.subject | Alignment | en |
dc.subject | Agglutinative languages | en |
dc.title | Uso de información morfológica en el alineamiento español-euskera | en |
dc.type | info:eu-repo/semantics/article | en |
dc.rights.accessRights | info:eu-repo/semantics/openAccess | - |
Appears in Collections: | Procesamiento del Lenguaje Natural - Nº 37 (septiembre 2006) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
PLN_37_32.pdf | 133,2 kB | Adobe PDF | Open Preview | |
Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.