Búsqueda de respuestas multilingüe : clasificación de preguntas en español basada en aprendizaje

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1435
Información del item - Informació de l'item - Item information
Título: Búsqueda de respuestas multilingüe : clasificación de preguntas en español basada en aprendizaje
Autor/es: García Cumbreras, Miguel Ángel | Martínez Santiago, Fernando | Ureña López, Luis Alfonso | Montejo Ráez, Arturo
Palabras clave: Clasificación de preguntas | Sistemas de búsqueda de respuestas | Aprendizaje automático | Traductores automáticos | Question classification | Question answering systems | Machine learning | Machine translation
Fecha de publicación: mar-2005
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: GARCÍA CUMBRERAS, Miguel Ángel, et al. “Búsqueda de respuestas multilingüe : clasificación de preguntas en español basada en aprendizaje”. Procesamiento del lenguaje natural. Nº 34 (marzo 2005), pp. 31-40
Resumen: Este artículo presenta un sistema de clasificación de preguntas en español basado en aprendizaje, utilizando colecciones en inglés y diversas máquinas de traducción online como recursos de traducción de la pregunta original en español al inglés. En este estudio se mide de forma cuantitativa la bondad de cuatro traductores automáticos para la pareja de idiomas español-inglés, comparando los resultados obtenidos para las preguntas originales en inglés con los obtenidos de cada una de las traducciones. El sistema se ha implementado de forma modular utilizando varios métodos de aprendizaje tales como LibSVM, Bayesian Logistic Regression o PLAUM. En la tarea de clasificación de preguntas se demuestra que la pérdida de precisión debida a la traducción automática es moderada, situandose entorno a un 5 %. | This paper presents an Spanish question classification system based on machine learning, that uses English collections, different online machine translators and other NLP English resources. The original Spanish questions are translated into English. Four machine translators are evaluated in terms of precision and the results are compared with the result obtained by using original English questions. Our system has been developed into separated modules and we have tested several machine learning methods, such as LibSVM, Bayesian Logistic Regression or PLAUM. The obtained results show that these online machine translators, used for the language pair Spanish-English, and for the query translation task in a multilingual question answering system, work well. It is showed that the loss of precision because of the machine translation, in a question classification task, is reasonable, around 5 %.
Patrocinador/es: Este trabajo ha sido financiado por el Ministerio de Ciencia y Tecnología mediante el proyecto TIC2003-07158-C04-04.
URI: http://hdl.handle.net/10045/1435
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 34 (marzo 2005)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_34_03.pdf214,71 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.