The role of statistical and semantic features in single-document extractive summarization

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/36345
Información del item - Informació de l'item - Item information
Título: The role of statistical and semantic features in single-document extractive summarization
Autor/es: Vodolazova, Tatiana | Lloret, Elena | Muñoz, Rafael | Palomar, Manuel
Grupo/s de investigación o GITE: Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave: Extractive text summarization | Semantics | Statistics | Coreference resolution
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: 10-abr-2013
Editor: Sciedu Press
Cita bibliográfica: Artificial Intelligence Research. 2013, 2(3): 35-44. doi:10.5430/air.v2n3p35
Resumen: This paper reports on the further results of the ongoing research analyzing the impact of a range of commonly used statistical and semantic features in the context of extractive text summarization. The features experimented with include word frequency, inverse sentence and term frequencies, stopwords filtering, word senses, resolved anaphora and textual entailment. The obtained results demonstrate the relative importance of each feature and the limitations of the tools available. It has been shown that the inverse sentence frequency combined with the term frequency yields almost the same results as the latter combined with stopwords filtering that in its turn proved to be a highly competitive baseline. To improve the suboptimal results of anaphora resolution, the system was extended with the second anaphora resolution module. The present paper also describes the first attempts of the internal document data representation.
URI: http://hdl.handle.net/10045/36345
ISSN: 1927-6974 (Print) | 1927-6982 (Online)
DOI: 10.5430/air.v2n3p35
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: This work is licensed under a Creative Commons Attribution 3.0 License
Revisión científica: si
Versión del editor: http://dx.doi.org/10.5430/air.v2n3p35
Aparece en las colecciones:INV - GPLSI - Artículos de Revistas

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
Thumbnail2013_Vodolazova_etal_AIR.pdf217,74 kBAdobe PDFAbrir Vista previa


Este ítem está licenciado bajo Licencia Creative Commons Creative Commons