Desambiguación léxica mediante marcas de especificidad

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1846
Información del item - Informació de l'item - Item information
Título: Desambiguación léxica mediante marcas de especificidad
Autor/es: Montoyo, Andres
Palabras clave: Ambigüedad léxica | Word sense disambiguation | WordNet | Enriquecimiento de WordNet semánticamente | Sistemas de clasificación | Lexical ambiguity | WordNet enrichment | Classification systems
Fecha de publicación: may-2002
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: MONTOYO GUIJARRO, Andrés. “Desambiguación léxica mediante marcas de especificidad”. Procesamiento del lenguaje natural. Nº 28 (mayo 2002), pp. 121-124
Resumen: Esta tesis presenta un método para resolver la ambigüedad léxica pura (semántica) en textos de dominios no registrados en cualquier lengua que tenga un repositorio de sentidos organizado como una base de conocimiento léxica. A este método de resolución de la ambigüedad léxica pura propuesto se denomina Método de Marcas de Especificidad y se basa en el uso de conocimiento lingüístico (información léxica y morfológica) y de conocimiento a partir de las relaciones léxicas y semánticas de la taxonomía de nombres de la base de conocimiento léxica WordNet. Además, se presenta la aplicación del método de Marcas de Especificidad con el objetivo de enriquecer semánticamente WordNet con etiquetas de dominio o categorías de otros sistemas de clasificación. | This thesis presents a method for the automatic disambiguating of nouns, using the notion of Specification Marks and employing the noun taxonomy of the WordNet lexical knowledge base. The method resolves the lexical ambiguity of nouns in any sort of text, and although it relies on the semantic relations (Hypernymy and Hyponymy) and the hierarchic organization of WordNet, it does not, however, require any sort of training process, no hand-coding of lexical entries, nor the hand-tagging of texts. Besides, this thesis presents a new method to enrich semantically WordNet with categories from general domain classification systems. The method is performed in two consecutive steps. First, a lexical knowledge word sense disambiguation process. Second, a set of rules to select the main concepts as representatives of each category. The method has been applied to label automatically WordNet synsets with Subject Codes from a standard news agencies classification system.
Descripción: Directores de la tesis: Manuel Palomar Sanz (Universidad de Alicante) y German Rigau Claramunt (Universitat Politècnica de Catalunya)
Patrocinador/es: Esta investigación ha sido parcialmente financiada por el Ministerio de Ciencia y Tecnología a través del proyecto TIC2000-0664-C02-01/02.
URI: http://hdl.handle.net/10045/1846
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 28 (mayo 2002)
INV - GPLSI - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_28_18.pdf142,54 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.