Analizador morfosintáctico de nombres propios y siglas

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/3935
Información del item - Informació de l'item - Item information
Title: Analizador morfosintáctico de nombres propios y siglas
Authors: Miranda García, Antonio
Keywords: Analizador morfosintáctico | Nombres propios | Siglas
Issue Date: Jul-1994
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: MIRANDA GARCÍA, Antonio. "Analizador morfosintáctico de nombres propios y siglas". Procesamiento del lenguaje natural. N. 15 (jul. 1994). ISSN 1135-5948
Abstract: El procesamiento del lenguaje natural dirigido a tareas de extracción de información o a la creación de bases de datos a partir de textos informativos, tiene que superar el problema de la falta de recursos léxicos suficientes, también conocido como embotellamiento léxico. Aunque el empleo de diccionarios computarizados y el desarrollo de sistemas expertos para el aprendizaje de palabras desconocidas han supuesto un notable avance, sin embargo, la cobertura léxica no es total, especialmente en el caso de los nombres propios. El reconocimiento de los nombres propios y su posterior análisis y clasificación es una tarea bastante compleja, debido fundamentalmente a su elevado número, a la gran variedad de formas que adoptan y a la ambigüedad que algunos de ellos presentan. El simple reconocimiento ya resulta difícil, porque el único distintivo con el que se cuenta es el empleo de la mayúscula, pista que no es válida para las palabras que van detrás de punto. Este estudio pretende una aproximación al tratamiento de los nombres propios y de las siglas en español a partir de textos que previamente han sido etiquetados morfológicamente. | Natural Language Processing systems developed to extract information from news texts or aimed at the creation of databases, are bound to overcome what is known as the lexical bottleneck. Although the employment of Machine Readable Dictionaries and the development of expert systems for lexical acquisition represent a remarkable progress, full lexical coverage is unlikely to be achieved, especially in the case of proper names. The recognition, analysis and classification of proper names is complex largely due to the vast amount and types of proper names in existence, the varying forms that they can adopt and to the ambiguity that some of them present. Recognition of proper names is difficult because their only distinguishing feature is the they all being with a capital letter, a path that is not valid for the words that go after a full stop. This study will attempt to deal with proper names and abbreviations in Spanish texts after a previous morphological tagging.
URI: http://hdl.handle.net/10045/3935
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Appears in Collections:Revistas - Procesamiento del Lenguaje Natural - Nº 15 (julio 1994)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_15_08.pdf730,45 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.