Generación y pesado de skipgrams y su aplicación al análisis de sentimientos
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10045/133266
Title: | Generación y pesado de skipgrams y su aplicación al análisis de sentimientos |
---|---|
Other Titles: | Skipgrams Generation and Weighting and its Application to Sentiment Analysis |
Authors: | Fernández Martínez, Javier | Gutiérrez, Yoan | Martínez-Barco, Patricio |
Research Group/s: | Procesamiento del Lenguaje y Sistemas de Información (GPLSI) |
Center, Department or Service: | Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos |
Keywords: | Skipgrams | Generación de términos | Pesado de términos | Análisis de sentimientos | Term generation | Term weighting | Sentiment analysis |
Issue Date: | Mar-2023 |
Publisher: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citation: | Procesamiento del Lenguaje Natural. 2023, 70: 213-223. https://doi.org/10.26342/2023-70-17 |
Abstract: | El modelado de skipgrams es una técnica para la generación de términos multi-palabra que conserva parte de la secuencialidad y flexibilidad del lenguaje. Sin embargo, en algunos casos el número de skipgrams generados puede ser excesivo a medida que se aumenta la distancia entre palabras. Además, esta distancia no suele ser tenida en cuenta a la hora de valorar los términos que se generan. En este trabajo proponemos una técnica para la generación y filtrado eficientes de skipgrams y un esquema de pesado que tiene en cuenta la distancia entre los términos, dando más importancia a aquellos más cercanos. Aplicaremos y evaluaremos estas propuestas en la tarea de análisis de sentimientos. | Skipgram modelling is a technique for generating multi-word terms that preserves some of the sequentiality and flexibility of the language. However, in some cases the number of skipgrams generated may become excessive as the distance between words increases. Moreover, this distance is often not taken into account when evaluating the terms that are generated. In this paper we propose a technique for efficient skipgram generation and filtering, and a weighing scheme that takes into account the distance between terms, giving more importance to those closer. We will apply and evaluate these proposals in the task of sentiment analysis. |
Sponsor: | Esta investigación ha sido financiada por la Universidad de Alicante, el Ministerio de Ciencia e Innovación de España, la Generalitat Valenciana y el Fondo Europeo de Desarrollo Regional (FEDER) a través de la siguiente financiación: a nivel nacional, se concedieron los proyectos TRIVIAL (PID2021-122263OB-C22), Social-Trust (PDC2022-133146-C22) y CLEARTEXT (TED2021-130707B-I00), financiados por MCIN/AEI/10.13039/501100011033 y European Union NextGenerationEU/PRTR; a nivel regional, la Generalitat Valenciana (Conselleria d’Educació, Investigació, Cultura i Esport), concedió financiación para NL4DISMIS (CIPROM/2021/21). Además, contó con el apoyo de dos acciones COST: CA19134 - “Distributed Knowledge Graphs” y CA19142 - “Leading Platform for European Citizens, Industries, Academia, and Policymakers in Media Accessibility”. |
URI: | http://hdl.handle.net/10045/133266 |
ISSN: | 1135-5948 |
DOI: | 10.26342/2023-70-17 |
Language: | spa |
Type: | info:eu-repo/semantics/article |
Rights: | © Sociedad Española para el Procesamiento del Lenguaje Natural. Distribuido bajo Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 |
Peer Review: | si |
Publisher version: | https://doi.org/10.26342/2023-70-17 |
Appears in Collections: | Procesamiento del Lenguaje Natural - Nº 70 (2023) INV - GPLSI - Artículos de Revistas |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
![]() | 1,1 MB | Adobe PDF | Open Preview | |
This item is licensed under a Creative Commons License