Hacia una arquitectura flexible para sistemas de predicción de palabras : propuesta de diseño y evaluación

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/1329
Información del item - Informació de l'item - Item information
Title: Hacia una arquitectura flexible para sistemas de predicción de palabras : propuesta de diseño y evaluación
Authors: Palazuelos Cagigas, Sira Elena | Martín Sánchez, José Luis | Hierrezuelo Sabatela, Lisset | Macías Guarasa, Javier
Keywords: Predicción de palabras | Gramática probabilística independiente del contexto | Gramáticas probabilísticas de palabras y categorías | Ahorro de pulsaciones | Personas con discapacidad | Ayudas técnicas | Word prediction | PCFG | Probabilistic grammars based on words and POS | Keystroke savings | People with disabilities | Technical aids
Issue Date: Sep-2005
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: PALAZUELOS CAGIGAS, Sira Elena, et al. “Hacia una arquitectura flexible para sistemas de predicción de palabras : propuesta de diseño y evaluación”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 311-318
Abstract: La predicción de palabras es un proceso mediante el cual se intenta predecir la palabra que un usuario está escribiendo o va a escribir, de forma simultánea a la propia escritura. Se utiliza fundamentalmente para disminuir el esfuerzo que requiere la entrada de textos en aplicaciones orientadas a personas con discapacidad. En el presente artículo se describe una propuesta para la arquitectura de un avanzado sistema de predicción de palabras. Esta arquitectura propuesta es modular y sumamente flexible, con bloques independientes e interfaces claras, de forma que permite utilizar fácilmente distintos algoritmos de predicción, e incluso predecir en varios idiomas. En la actualidad, se ha implementado un sistema de predicción de palabras según la arquitectura propuesta, que cuenta con un diccionario fijo para castellano con 160000 entradas, la posibilidad de generar diccionarios personales del usuario, y métodos de predicción basados en gramáticas probabilísticas de palabras y categorías y en el uso de una gramática formal. Dependiendo de la configuración utilizada, el sistema puede predecir correctamente más del 94% de las palabras, y reducir el número de pulsaciones necesarias para escribir el texto en más del 50%. Prueba de la flexibilidad de la arquitectura es que esta implementación se ha incluido en varios programas de predicción en distintos idiomas. | Word prediction is a process that tries to guess the word a user is writing, at the same time he/she is doing it. It is mainly used to decrease the effort needed to write a text in applications devoted to people with disabilities. In this paper, we describe a proposal for the architecture of advanced word prediction systems. The proposed architecture is modular and flexible, with common interfaces between the modules to allow the use of different prediction algorithms or even the prediction in a different language. A word prediction system has been implemented according to this architecture. It consists of a 160000 entries lexicon for Spanish (that cannot be modified by the user), the possibility to create and store personal lexicons, prediction methods based on words and POS (parts of speech) probabilistic grammars and a formal grammar. The system can predict more than 94% of the words and reduce the keystrokes needed to write a text more than 50%, depending on the configuration of the prediction. The flexibility of the architecture allowed us to include the word prediction system in several applications for different languages.
URI: http://hdl.handle.net/10045/1329
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Appears in Collections:Revistas - Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_35_38.pdf205,67 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.