Utilización de pasajes de tamaño variable, para mejorar el proceso de recuperación de información

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/1749
Información del item - Informació de l'item - Item information
Title: Utilización de pasajes de tamaño variable, para mejorar el proceso de recuperación de información
Authors: Llopis, Fernando | Ferrández, Antonio | Vicedo, Jose-Luis
Keywords: Recuperación de información | Recuperación por pasajes | Búsqueda de respuestas | Information retrieval | Passage retrieval | Question answering
Issue Date: May-2002
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: LLOPIS PASCUAL, Fernando; FERRÁNDEZ RODRÍGUEZ, Antonio; VICEDO GONZÁLEZ, José Luis. “Utilización de pasajes de tamaño variable, para mejorar el proceso de recuperación de información”. Procesamiento del lenguaje natural. Nº 28 (mayo 2002), pp. 89-98
Abstract: Trabajos previos demuestran que la utilización de fragmentos de documentos como unidad básica de información, para calcular la relevancia de un documento con respecto a una pregunta, mejora sensiblemente los resultados de los sistemas de recuperación de información. Sin embargo, no se ha llegado a un consenso acerca de cómo definir esos fragmentos de texto (o párrafos) de forma que el sistema alcance un comportamiento óptimo. El presente artículo presenta un sistema de recuperación de información, basado en la definición de pasajes de tamaño variable. Cada pasaje está formado por un número determinado de las frases que forman el documento. El número de frases seleccionadas para cada pasaje dependerá de la localización de las palabras de la pregunta en cada documento. La evaluación realizada permite comparar el rendimiento de este modelo con un sistema estándar de recuperación de documentos, así como con otras propuestas que utilizan diferentes métodos de definición de pasajes. | Previous works show that the use of fragments of documents as the basic unit of information to calculate the relevance of a document with regard to a query, improves the results of information retrieval systems. However, it has not been agreed how these fragments of texts should be obtained in order to obtain optimum results. This paper presents an information retrieval system that is based on the definition of passages of variable size. Each passage is formed by a number of sentences that formed the document. The number of sentences by each passage will depend on the position of the query words in each document. The accomplished evaluation allows comparing the performance of this model with a standard information retrieval system, as well as with other passage retrieval systems.
Sponsor: Este artículo ha sido financiado parcialmente por el Gobierno Español (CICyT) dentro del proyecto número TIC2000-0664-C02-02 y TIC2001-3530-C02-02.
URI: http://hdl.handle.net/10045/1749
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 28 (mayo 2002)
INV - GPLSI - Artículos de Revistas
INV - I+GE - Artículos de Revistas

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_28_08.pdf228,96 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.