Búsqueda de respuestas multilingüe : clasificación de preguntas en español basada en aprendizaje
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10045/1435
Title: | Búsqueda de respuestas multilingüe : clasificación de preguntas en español basada en aprendizaje |
---|---|
Authors: | García Cumbreras, Miguel Ángel | Martínez Santiago, Fernando | Ureña López, Luis Alfonso | Montejo Ráez, Arturo |
Keywords: | Clasificación de preguntas | Sistemas de búsqueda de respuestas | Aprendizaje automático | Traductores automáticos | Question classification | Question answering systems | Machine learning | Machine translation |
Issue Date: | Mar-2005 |
Publisher: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citation: | GARCÍA CUMBRERAS, Miguel Ángel, et al. “Búsqueda de respuestas multilingüe : clasificación de preguntas en español basada en aprendizaje”. Procesamiento del lenguaje natural. Nº 34 (marzo 2005), pp. 31-40 |
Abstract: | Este artículo presenta un sistema de clasificación de preguntas en español basado en aprendizaje, utilizando colecciones en inglés y diversas máquinas de traducción online como recursos de traducción de la pregunta original en español al inglés. En este estudio se mide de forma cuantitativa la bondad de cuatro traductores automáticos para la pareja de idiomas español-inglés, comparando los resultados obtenidos para las preguntas originales en inglés con los obtenidos de cada una de las traducciones. El sistema se ha implementado de forma modular utilizando varios métodos de aprendizaje tales como LibSVM, Bayesian Logistic Regression o PLAUM. En la tarea de clasificación de preguntas se demuestra que la pérdida de precisión debida a la traducción automática es moderada, situandose entorno a un 5 %. | This paper presents an Spanish question classification system based on machine learning, that uses English collections, different online machine translators and other NLP English resources. The original Spanish questions are translated into English. Four machine translators are evaluated in terms of precision and the results are compared with the result obtained by using original English questions. Our system has been developed into separated modules and we have tested several machine learning methods, such as LibSVM, Bayesian Logistic Regression or PLAUM. The obtained results show that these online machine translators, used for the language pair Spanish-English, and for the query translation task in a multilingual question answering system, work well. It is showed that the loss of precision because of the machine translation, in a question classification task, is reasonable, around 5 %. |
Sponsor: | Este trabajo ha sido financiado por el Ministerio de Ciencia y Tecnología mediante el proyecto TIC2003-07158-C04-04. |
URI: | http://hdl.handle.net/10045/1435 |
ISSN: | 1135-5948 |
Language: | spa |
Type: | info:eu-repo/semantics/article |
Appears in Collections: | Procesamiento del Lenguaje Natural - Nº 34 (marzo 2005) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
![]() | 214,71 kB | Adobe PDF | Open Preview | |
Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.