Andrade Garda, Javier, Álvarez Lebredo, Conchita, Valderruten Vidal, Alberto, Sotelo Docío, Susana Un supresor de ambigüedades léxicas mediante métodos estadísticos ANDRADE GARDA, Javier, et al. “Un supresor de ambigüedades léxicas mediante métodos estadísticos”. Procesamiento del lenguaje natural. Nº 20 (jun. 1997), pp. 1-12 URI: http://hdl.handle.net/10045/2103 DOI: ISSN: 1135-5948 Abstract: Presentamos el trabajo realizado para conseguir un sistema que, integrado en el proyecto GALENA (Generador de Analizadores de LEnguajes NAturales), logre eliminar, de forma estadística, las ambigüedades que provocan las palabras al ser tratadas por el módulo de análisis léxico. El análisis léxico proporciona a las palabras unas etiquetas, es decir, descripciones que contienen toda la información (tipológica, morfológica...) necesaria para caracterizarlas en el conjunto del léxico de la lengua. A cada palabra aislada, fuera de contexto, pueden corresponderle varias etiquetas. Esta situación imposibilita el análisis sintáctico de los textos. Surge, por tanto, la necesidad de eliminar las ambigüedades en el proceso de etiquetación. El objetivo del presente trabajo es proveer de una única etiqueta a cada palabra, asignando la que en cada caso sea más probable según la historia del texto en estudio. Para ello, es necesario un análisis estadístico de textos del mismo estilo literario que el que va a ser tratado, y la aplicación de ese estudio al texto en cuestión. El supresor de ambigüedades que proponemos permite la selección, por parte del usuario, de la información léxica a utilizar en la desambiguación, y ofrece funcionalidades complementarias para el tratamiento de las matrices de aprendizaje. Keywords:Etiquetado léxico, Ambigüedad, Estadística, Matriz de aprendizaje, Desambiguación Sociedad Española para el Procesamiento del Lenguaje Natural info:eu-repo/semantics/article