Métodos de aprendizaje automático aplicados a la predicción de palabras para portugués de Brasil

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/14725
Información del item - Informació de l'item - Item information
Title: Métodos de aprendizaje automático aplicados a la predicción de palabras para portugués de Brasil
Other Titles: Machine learning approaches applied to Brazilian Portuguese word prediction
Authors: Cruz Cavalieri, Daniel | Bastos Filho, Teodiano Freire | Palazuelos Cagigas, Sira Elena | Macías Guarasa, Javier | Martín Sánchez, José Luis
Keywords: Aprendizaje automático | Predicción de palabras | Procesamiento del lenguaje natural | Machine learning | Word prediction | Natural language processing
Knowledge Area: Lenguajes y Sistemas Informáticos
Issue Date: Oct-2010
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: CRUZ CAVALIERI, Daniel, et al. “Métodos de aprendizaje automático aplicados a la predicción de palabras para portugués de Brasil”. Procesamiento del Lenguaje Natural. N. 45 (2010). ISSN 1135-5948
Abstract: Las personas con discapacidades físicas pueden tener serios problemas para utilizar el teclado de los ordenadores para escribir. Por esta razón suelen utilizar herramientas específicas que incluyen sistemas de ayuda a la escritura como la predicción de palabras para reducir el número de pulsaciones necesarias para escribir el texto. La predicción de palabras se puede basar en información estadística, gramatical, específica del tema y/o del usuario, etc. En este trabajo se trata de incrementar la calidad de la predicción de palabras en portugués de Brasil mejorando la predicción de la categoría de la palabra predicha. Para ello se proponen los siguientes métodos: redes neuronales artificiales, máquinas de soporte vectorial, modelos logísticos regularizados y un clasificador de Bayes. Al incorporarlos a la predicción de palabras se obtienen ahorros en el número de pulsaciones necesarias para escribir un texto entre 32,55 % y 34,58 %. | People with physical disabilities may have serious problems to use computer keyboards to write. For this reason, they may use specific tools that include systems to assist the writing process, such us word prediction, in order to reduce the number of keystrokes needed to write the text. Word prediction may be based on different sources of information: statistical, grammatical, specific of the subject or/and the user, etc. In this paper we increase the quality of the word prediction in Brazilian Portuguese by improving the prediction of the part of speech (POS) of the predicted word. We propose the following methods to predict the POS: artificial neural networks, support vector machines, regularized logistic models and a naïve Bayes classifier. When included in the word prediction system, they save between 32.55 % and 34,58 % of the keystrokes needed to write the text.
Sponsor: CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, e FACITEC - Fundação de Apoio à Ciência e Tecnologia do Município de Vitória.
URI: http://hdl.handle.net/10045/14725
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Peer Review: si
Appears in Collections:Revistas - Procesamiento del Lenguaje Natural - Nº 45 (2010)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_45_23.pdf299,77 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.