Métodos de aprendizaje automático aplicados a la predicción de palabras para portugués de Brasil
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/14725
Título: | Métodos de aprendizaje automático aplicados a la predicción de palabras para portugués de Brasil |
---|---|
Título alternativo: | Machine learning approaches applied to Brazilian Portuguese word prediction |
Autor/es: | Cruz Cavalieri, Daniel | Bastos Filho, Teodiano Freire | Palazuelos Cagigas, Sira Elena | Macías Guarasa, Javier | Martín Sánchez, José Luis |
Palabras clave: | Aprendizaje automático | Predicción de palabras | Procesamiento del lenguaje natural | Machine learning | Word prediction | Natural language processing |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | oct-2010 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | CRUZ CAVALIERI, Daniel, et al. “Métodos de aprendizaje automático aplicados a la predicción de palabras para portugués de Brasil”. Procesamiento del Lenguaje Natural. N. 45 (2010). ISSN 1135-5948 |
Resumen: | Las personas con discapacidades físicas pueden tener serios problemas para utilizar el teclado de los ordenadores para escribir. Por esta razón suelen utilizar herramientas específicas que incluyen sistemas de ayuda a la escritura como la predicción de palabras para reducir el número de pulsaciones necesarias para escribir el texto. La predicción de palabras se puede basar en información estadística, gramatical, específica del tema y/o del usuario, etc. En este trabajo se trata de incrementar la calidad de la predicción de palabras en portugués de Brasil mejorando la predicción de la categoría de la palabra predicha. Para ello se proponen los siguientes métodos: redes neuronales artificiales, máquinas de soporte vectorial, modelos logísticos regularizados y un clasificador de Bayes. Al incorporarlos a la predicción de palabras se obtienen ahorros en el número de pulsaciones necesarias para escribir un texto entre 32,55 % y 34,58 %. | People with physical disabilities may have serious problems to use computer keyboards to write. For this reason, they may use specific tools that include systems to assist the writing process, such us word prediction, in order to reduce the number of keystrokes needed to write the text. Word prediction may be based on different sources of information: statistical, grammatical, specific of the subject or/and the user, etc. In this paper we increase the quality of the word prediction in Brazilian Portuguese by improving the prediction of the part of speech (POS) of the predicted word. We propose the following methods to predict the POS: artificial neural networks, support vector machines, regularized logistic models and a naïve Bayes classifier. When included in the word prediction system, they save between 32.55 % and 34,58 % of the keystrokes needed to write the text. |
Patrocinador/es: | CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior, e FACITEC - Fundação de Apoio à Ciência e Tecnologia do Município de Vitória. |
URI: | http://hdl.handle.net/10045/14725 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Revisión científica: | si |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 45 (2010) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_45_23.pdf | 299,77 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.