Aplicación del procesamiento de lenguaje natural en la recuperación de información
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10045/1434
Title: | Aplicación del procesamiento de lenguaje natural en la recuperación de información |
---|---|
Authors: | Rojas Hernández, Yenory | Ferrández, Antonio | Peral, Jesús |
Keywords: | Procesamiento del lenguaje natural | Recuperación de información | Natural language processing | Information retrieval |
Issue Date: | Mar-2005 |
Publisher: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citation: | ROJAS HERNÁNDEZ, Yenory; FERRÁNDEZ RODRÍGUEZ, Antonio; PERAL CORTÉS, Jesús. “Aplicación del procesamiento de lenguaje natural en la recuperación de información”. Procesamiento del lenguaje natural. Nº 34 (marzo 2005), pp. 17-30 |
Abstract: | En este artículo se presenta un modelo innovador para la Recuperación de Información monolingüe en inglés y español. El modelo usa técnicas de Procesamiento de Lenguaje Natural (un etiquetador de categorías gramaticales –POS tagger–, un analizador sintáctico parcial y un módulo para la resolución de la anáfora) para mejorar la precisión de los sistemas tradicionales de Recuperación de Información; para ello, se realiza una indexación de las “entidades” y las “relaciones” entre estas entidades en los documentos. Para la evaluación del modelo se ha utilizado los corpus CLEF en español e inglés. Para las preguntas en inglés, se ha obtenido una mejora de 35,11% en la precisión media. Para las preguntas en español, el aumento máximo es de 37,18%. | In this paper, a novel model for monolingual Information Retrieval in English and Spanish language is proposed. This model uses Natural Language Processing techniques (a POStagger, a Partial Parser, and an Anaphora Resolver) in order to improve the precision of traditional IR systems, by means of indexing the “entities” and the “relations” between these entities in the documents. This model is evaluated on the Spanish and English CLEF corpora. For the English queries, there is a maximum increase of 35.11% in the average precision. For the Spanish queries, the maximum increase is 37.18%. |
URI: | http://hdl.handle.net/10045/1434 |
ISSN: | 1135-5948 |
Language: | spa |
Type: | info:eu-repo/semantics/article |
Appears in Collections: | Procesamiento del Lenguaje Natural - Nº 34 (marzo 2005) INV - GPLSI - Artículos de Revistas |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
PLN_34_02.pdf | 186,66 kB | Adobe PDF | Open Preview | |
Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.