Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/3018
Información del item - Informació de l'item - Item information
Título: Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego
Autor/es: Gamallo Otero, Pablo | Pichel Campos, José Ramom
Palabras clave: Extracción de léxico multilingüe | Corpus comparables | Traducción automática | Multilingual lexical extraction | Comparable corpora | Automatic translation
Fecha de publicación: sep-2007
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: GAMALLO OTERO, Pablo; PICHEL CAMPOS, José Ramom. "Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948, pp. 241-248
Resumen: Los trabajos sobre extracción de equivalentes de traducción a partir de corpus comparables no-paralelos no han sido muy numerosos hasta ahora. La raz´on principal radica en los pobres resultados obtenidos si los comparamos con los enfoques que utilizan corpus paralelos y alineados. El método propuesto en este artículo, basado en el uso de contextos semilla generados a partir de diccionarios bilingües externos, obtiene tasas de precisión próximas a los métodos con corpus paralelos. Estos resultados apoyan la idea de que la ingente cantidad de corpus comparables disponibles via Web puede llegar a ser una fuente importante de conocimiento lexicogr áfico. En este artículo, se describen los experimentos realizados sobre un corpus comparable castellano-gallego. | So far, research on extraction of word translations from comparable, non-parallel corpora has not been very popular. The main reason was the poor results when compared to those obtained from aligned parallel corpora. The method proposed in this paper, relying on seed contexts generated from external bilingual dictionaries, allows us to achieve results similar to those from parallel corpus. In this way, the huge amount of comparable corpora available via Web can be viewed as a never-ending source of lexicographic information. In this paper, we desbribe the experiments performed on a comparable, Spanish-Galician corpus.
Patrocinador/es: Este trabajo ha sido subvencionado por el Ministerio de Educación y Ciencia a cargo del proyecto GARI-COTER, ref: HUM2004-05658-D02-02
URI: http://hdl.handle.net/10045/3018
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_39_29.pdf175,3 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.