Analizador morfosintáctico de nombres propios y siglas

Miranda García, Antonio

Analizador morfosintáctico de nombres propios y siglas

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/3935

Información del item - Informació de l'item - Item information
Título:	Analizador morfosintáctico de nombres propios y siglas
Autor/es:	Miranda García, Antonio
Palabras clave:	Analizador morfosintáctico \| Nombres propios \| Siglas
Fecha de publicación:	jul-1994
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	MIRANDA GARCÍA, Antonio. "Analizador morfosintáctico de nombres propios y siglas". Procesamiento del lenguaje natural. N. 15 (jul. 1994). ISSN 1135-5948
Resumen:	El procesamiento del lenguaje natural dirigido a tareas de extracción de información o a la creación de bases de datos a partir de textos informativos, tiene que superar el problema de la falta de recursos léxicos suficientes, también conocido como embotellamiento léxico. Aunque el empleo de diccionarios computarizados y el desarrollo de sistemas expertos para el aprendizaje de palabras desconocidas han supuesto un notable avance, sin embargo, la cobertura léxica no es total, especialmente en el caso de los nombres propios. El reconocimiento de los nombres propios y su posterior análisis y clasificación es una tarea bastante compleja, debido fundamentalmente a su elevado número, a la gran variedad de formas que adoptan y a la ambigüedad que algunos de ellos presentan. El simple reconocimiento ya resulta difícil, porque el único distintivo con el que se cuenta es el empleo de la mayúscula, pista que no es válida para las palabras que van detrás de punto. Este estudio pretende una aproximación al tratamiento de los nombres propios y de las siglas en español a partir de textos que previamente han sido etiquetados morfológicamente. \| Natural Language Processing systems developed to extract information from news texts or aimed at the creation of databases, are bound to overcome what is known as the lexical bottleneck. Although the employment of Machine Readable Dictionaries and the development of expert systems for lexical acquisition represent a remarkable progress, full lexical coverage is unlikely to be achieved, especially in the case of proper names. The recognition, analysis and classification of proper names is complex largely due to the vast amount and types of proper names in existence, the varying forms that they can adopt and to the ambiguity that some of them present. Recognition of proper names is difficult because their only distinguishing feature is the they all being with a capital letter, a path that is not valid for the words that go after a full stop. This study will attempt to deal with proper names and abbreviations in Spanish texts after a previous morphological tagging.
URI:	http://hdl.handle.net/10045/3935
ISSN:	1135-5948
Idioma:	spa
Tipo:	info:eu-repo/semantics/article
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 15 (julio 1994)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_15_08.pdf		730,45 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo