Combinando patrones léxico-sintácticos y análisis de tópicos para la extracción automática de frases relevantes en textos
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10045/69113
Title: | Combinando patrones léxico-sintácticos y análisis de tópicos para la extracción automática de frases relevantes en textos |
---|---|
Other Titles: | Combining lexical-syntactic patterns and topic analysis for automatic keyphrase extraction from texts |
Authors: | Pérez-Guadarramas, Yamel | Rodríguez-Blanco, Aramis | Simón-Cuevas, Alfredo | Hojas-Mazo, Wenny | Olivas, José Ángel |
Keywords: | Extracción automática de frases relevantes | Minería de texto | Procesamiento de lenguaje natural | Automatic keyphrase extraction | Text mining | Natural language processing |
Knowledge Area: | Lenguajes y Sistemas Informáticos |
Issue Date: | Sep-2017 |
Publisher: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citation: | Procesamiento del Lenguaje Natural. 2017, 59: 39-46 |
Abstract: | La extracción automática de frases relevantes constituye una tarea de gran importancia para muchas soluciones computacionales en el área del procesamiento de lenguaje natural y la minería de texto. En este trabajo se propone un nuevo método no supervisado para la extracción de frases relevantes en textos, en el cual se combina el uso de patrones léxico-sintácticos con una estrategia de análisis de tópicos basada en grafo. El método fue evaluado con los corpus SemEval-2010 e INSPEC y comparado con otras propuestas del estado del arte, obteniéndose resultados muy prometedores. | The automatic keyphrases extraction is a useful task for many computational solutions in the natural language processing and text mining areas. In this paper, a new unsupervised method for keyphrase extraction from texts is proposed, in which the use of lexical-syntactic patterns is combined with a graph-based topic analysis strategy. The method was evaluated with the SemEval-2010 and INSPEC corpus, and compared with other state-of-the-art proposals, obtaining promising results. |
Sponsor: | Este trabajo ha sido parcialmente financiado por el proyecto METODOS RIGUROSOS PARA EL INTERNET DEL FUTURO (MERINET), financiado por el Fondo Europeo de Desarrollo Regional (FEDER) y el Ministerio de Economía y Competitividad (MINECO), Ref. TIN2016-76843-C4-2-R. |
URI: | http://hdl.handle.net/10045/69113 |
ISSN: | 1135-5948 |
Language: | spa |
Type: | info:eu-repo/semantics/article |
Rights: | © Sociedad Española para el Procesamiento del Lenguaje Natural |
Peer Review: | si |
Publisher version: | http://journal.sepln.org/sepln/ojs/ojs/index.php/pln |
Appears in Collections: | Procesamiento del Lenguaje Natural - Nº 59 (2017) |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
PLN_59_04.pdf | 1,32 MB | Adobe PDF | Open Preview | |
Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.