Advanced Search

RUA > Journals and Conferences > Journals > Procesamiento del Lenguaje Natural > Revistas - Procesamiento del Lenguaje Natural - Nº 47 (2011) >

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/18518

Show this item's statistics

Título: COMPENDIUM: una herramienta de generación de resúmenes modular
Título alternativo: COMPENDIUM: a modular text summarization tool
Autor/es: Lloret Pastor, Elena | Palomar Sanz, Manuel
Grupo/s de investigación o GITE: Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave: Procesamiento del lenguaje natural | Generación de resúmenes de textos | Natural language processing | Text summarization
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Issue Date: Sep-2011
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: LLORET, Elena; PALOMAR, Manuel. “COMPENDIUM: una herramienta de generación de resúmenes modular”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 107-115
Resumen: En este artículo presentamos COMPENDIUM, una herramienta de generación de resúmenes de textos modular. Esta herramienta se compone de un módulo central con cinco etapas bien diferenciadas: i) análisis lingüístico; ii) detección de redundancia; iii) identificación del tópico; iv) detección de relevancia; y v) generación del resumen, y una serie de módulos adicionales que permiten incrementar las funcionalidades de la herramienta permitiendo la generación de distintos tipos de resúmenes, como por ejemplo orientados a un tema concreto. Realizamos una evaluación exhaustiva en dos dominios distintos (noticias de prensa y documentos sobre lugares turísticos) y analizamos diferentes tipos de resúmenes generados con COMPENDIUM (mono-documento, multi-documento, genéricos y orientados a un tema). Además, comparamos nuestro sistema con otros sistemas de generación de resúmenes actuales. Los resultados que se obtienen demuestran que la herramienta COMPENDIUM es capaz de generar resúmenes competitivos para los distintos tipos de resúmenes propuestos. | This paper presents COMPENDIUM, a modular text summarization tool. On the one hand, it consists of a core module, which comprises five distinct stages: i) linguistic analysis; ii) redundancy detection; iii) topic identification; iv) relevance detection; and v) summary generation. On the other hand, it integrates additional modules, with the purpose of increasing the capabilities of the text summarization tool, thus allowing the generation of different types of summaries, such as query-focused summaries. An exhaustive evaluation has been carried out in two domains (newswire and tourist places) in order to analyze the summaries generated with COMPENDIUM (single-document, multi-document, generic, and query-focused). Moreover, a comparison between our tool and other summarizers is also performed. The results obtained show that COMPENDIUM is able to generate competitive summaries for the different types of summaries proposed.
Patrocinador/es: Este artículo ha sido cofinanciado por el Ministerio de Ciencia e Innovación (beca FPI BES-2007-16268 y proyectos TIN2006-15265-C06-01 y TIN2009-13391-C04-01) y por la Conselleria d’Educació de la Generalitat Valenciana (proyectos PROMETEO/2009/119 y ACOMP/2011/001).
URI: http://hdl.handle.net/10045/18518
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Appears in Collections:Revistas - Procesamiento del Lenguaje Natural - Nº 47 (2011)
INV - GPLSI - Artículos de Revistas

Files in This Item:

File Description SizeFormat
PLN_47_11.pdf815,65 kBAdobe PDFOpen

RefWorks Export

Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated

[Web map] [Contact] [Accesibility]

© Universitat d'Alacant / Universidad de Alicante

facebook   twitter   tuenti   meneame