Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/3018
Título: | Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego |
---|---|
Autor/es: | Gamallo Otero, Pablo | Pichel Campos, José Ramom |
Palabras clave: | Extracción de léxico multilingüe | Corpus comparables | Traducción automática | Multilingual lexical extraction | Comparable corpora | Automatic translation |
Fecha de publicación: | sep-2007 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | GAMALLO OTERO, Pablo; PICHEL CAMPOS, José Ramom. "Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948, pp. 241-248 |
Resumen: | Los trabajos sobre extracción de equivalentes de traducción a partir de corpus comparables no-paralelos no han sido muy numerosos hasta ahora. La raz´on principal radica en los pobres resultados obtenidos si los comparamos con los enfoques que utilizan corpus paralelos y alineados. El método propuesto en este artículo, basado en el uso de contextos semilla generados a partir de diccionarios bilingües externos, obtiene tasas de precisión próximas a los métodos con corpus paralelos. Estos resultados apoyan la idea de que la ingente cantidad de corpus comparables disponibles via Web puede llegar a ser una fuente importante de conocimiento lexicogr áfico. En este artículo, se describen los experimentos realizados sobre un corpus comparable castellano-gallego. | So far, research on extraction of word translations from comparable, non-parallel corpora has not been very popular. The main reason was the poor results when compared to those obtained from aligned parallel corpora. The method proposed in this paper, relying on seed contexts generated from external bilingual dictionaries, allows us to achieve results similar to those from parallel corpus. In this way, the huge amount of comparable corpora available via Web can be viewed as a never-ending source of lexicographic information. In this paper, we desbribe the experiments performed on a comparable, Spanish-Galician corpus. |
Patrocinador/es: | Este trabajo ha sido subvencionado por el Ministerio de Educación y Ciencia a cargo del proyecto GARI-COTER, ref: HUM2004-05658-D02-02 |
URI: | http://hdl.handle.net/10045/3018 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_39_29.pdf | 175,3 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.