Una herramienta para la manipulación de corpora bilingüe usando distancia léxica

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/3167
Información del item - Informació de l'item - Item information
Título: Una herramienta para la manipulación de corpora bilingüe usando distancia léxica
Autor/es: Borrego Ropero, Rafael | Díaz Madrigal, Víctor Jesús
Palabras clave: Alineamiento | Etiquetado de entidades | Edit Distance | Corpora Bilingüe | Alignment | Name entity recognition | Bilingual corpora
Fecha de publicación: sep-2007
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: BORREGO ROPERO, Rafael; DÍAZ MADRIGAL, Victor Jesús. "Una herramienta para la manipulación de corpora bilingüe usando distancia léxica". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948, pp. 275-276
Resumen: En este artículo se presenta una herramienta que permite anotar corpora bilingüe y realizar alineamiento entre textos usando heurísticas basadas en frecuencia, posición y cercanía léxica (con Edit Distance). La anotación de corpora bilingue es una tarea muy laboriosa pero esencial a la hora de desarrollar bases de conocimiento para la realización de traducciones automáticas entre distintos idiomas. Esta herramienta ayuda esta tarea, permitiendo anotar de forma rápida y sencilla. Incluye características que facilitan la edición de textos planos y de textos anotados. | In this article is presented a tool for labeling bilingual parallel corpora and aligning texts using heuristics based on word frequency, position and lexicographical similarity (using Edit Distance). Bilingual corpora annotation is a very laborious task but essential at the time of developing knowledge bases for the accomplishment of automatic translations between different languages. This tool helps to this task, allowing to annotate texts in a fast and simple way. It includes characteristics that help editing plain and annotated texts.
Patrocinador/es: Este trabajo ha sido parcialmente financiado por el Ministerio de Educación y Ciencia (TIN 2004-07246-C03-03).
URI: http://hdl.handle.net/10045/3167
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Revistas - Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_39_33.pdf60,4 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.