Combinando patrones léxico-sintácticos y análisis de tópicos para la extracción automática de frases relevantes en textos

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/69113
Información del item - Informació de l'item - Item information
Title: Combinando patrones léxico-sintácticos y análisis de tópicos para la extracción automática de frases relevantes en textos
Other Titles: Combining lexical-syntactic patterns and topic analysis for automatic keyphrase extraction from texts
Authors: Pérez-Guadarramas, Yamel | Rodríguez-Blanco, Aramis | Simón-Cuevas, Alfredo | Hojas-Mazo, Wenny | Olivas, José Ángel
Keywords: Extracción automática de frases relevantes | Minería de texto | Procesamiento de lenguaje natural | Automatic keyphrase extraction | Text mining | Natural language processing
Knowledge Area: Lenguajes y Sistemas Informáticos
Issue Date: Sep-2017
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: Procesamiento del Lenguaje Natural. 2017, 59: 39-46
Abstract: La extracción automática de frases relevantes constituye una tarea de gran importancia para muchas soluciones computacionales en el área del procesamiento de lenguaje natural y la minería de texto. En este trabajo se propone un nuevo método no supervisado para la extracción de frases relevantes en textos, en el cual se combina el uso de patrones léxico-sintácticos con una estrategia de análisis de tópicos basada en grafo. El método fue evaluado con los corpus SemEval-2010 e INSPEC y comparado con otras propuestas del estado del arte, obteniéndose resultados muy prometedores. | The automatic keyphrases extraction is a useful task for many computational solutions in the natural language processing and text mining areas. In this paper, a new unsupervised method for keyphrase extraction from texts is proposed, in which the use of lexical-syntactic patterns is combined with a graph-based topic analysis strategy. The method was evaluated with the SemEval-2010 and INSPEC corpus, and compared with other state-of-the-art proposals, obtaining promising results.
Sponsor: Este trabajo ha sido parcialmente financiado por el proyecto METODOS RIGUROSOS PARA EL INTERNET DEL FUTURO (MERINET), financiado por el Fondo Europeo de Desarrollo Regional (FEDER) y el Ministerio de Economía y Competitividad (MINECO), Ref. TIN2016-76843-C4-2-R.
URI: http://hdl.handle.net/10045/69113
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Rights: © Sociedad Española para el Procesamiento del Lenguaje Natural
Peer Review: si
Publisher version: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 59 (2017)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_59_04.pdf1,32 MBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.