Generación y pesado de skipgrams y su aplicación al análisis de sentimientos

Fernández Martínez, Javier; Gutiérrez, Yoan; Martínez-Barco, Patricio

Generación y pesado de skipgrams y su aplicación al análisis de sentimientos

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/133266

Información del item - Informació de l'item - Item information
Título:	Generación y pesado de skipgrams y su aplicación al análisis de sentimientos
Título alternativo:	Skipgrams Generation and Weighting and its Application to Sentiment Analysis
Autor/es:	Fernández Martínez, Javier \| Gutiérrez, Yoan \| Martínez-Barco, Patricio
Grupo/s de investigación o GITE:	Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
Centro, Departamento o Servicio:	Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Palabras clave:	Skipgrams \| Generación de términos \| Pesado de términos \| Análisis de sentimientos \| Term generation \| Term weighting \| Sentiment analysis
Fecha de publicación:	mar-2023
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	Procesamiento del Lenguaje Natural. 2023, 70: 213-223. https://doi.org/10.26342/2023-70-17
Resumen:	El modelado de skipgrams es una técnica para la generación de términos multi-palabra que conserva parte de la secuencialidad y flexibilidad del lenguaje. Sin embargo, en algunos casos el número de skipgrams generados puede ser excesivo a medida que se aumenta la distancia entre palabras. Además, esta distancia no suele ser tenida en cuenta a la hora de valorar los términos que se generan. En este trabajo proponemos una técnica para la generación y filtrado eficientes de skipgrams y un esquema de pesado que tiene en cuenta la distancia entre los términos, dando más importancia a aquellos más cercanos. Aplicaremos y evaluaremos estas propuestas en la tarea de análisis de sentimientos. \| Skipgram modelling is a technique for generating multi-word terms that preserves some of the sequentiality and flexibility of the language. However, in some cases the number of skipgrams generated may become excessive as the distance between words increases. Moreover, this distance is often not taken into account when evaluating the terms that are generated. In this paper we propose a technique for efficient skipgram generation and filtering, and a weighing scheme that takes into account the distance between terms, giving more importance to those closer. We will apply and evaluate these proposals in the task of sentiment analysis.
Patrocinador/es:	Esta investigación ha sido financiada por la Universidad de Alicante, el Ministerio de Ciencia e Innovación de España, la Generalitat Valenciana y el Fondo Europeo de Desarrollo Regional (FEDER) a través de la siguiente financiación: a nivel nacional, se concedieron los proyectos TRIVIAL (PID2021-122263OB-C22), Social-Trust (PDC2022-133146-C22) y CLEARTEXT (TED2021-130707B-I00), financiados por MCIN/AEI/10.13039/501100011033 y European Union NextGenerationEU/PRTR; a nivel regional, la Generalitat Valenciana (Conselleria d’Educació, Investigació, Cultura i Esport), concedió financiación para NL4DISMIS (CIPROM/2021/21). Además, contó con el apoyo de dos acciones COST: CA19134 - “Distributed Knowledge Graphs” y CA19142 - “Leading Platform for European Citizens, Industries, Academia, and Policymakers in Media Accessibility”.
URI:	http://hdl.handle.net/10045/133266
ISSN:	1135-5948
DOI:	10.26342/2023-70-17
Idioma:	spa
Tipo:	info:eu-repo/semantics/article
Derechos:	© Sociedad Española para el Procesamiento del Lenguaje Natural. Distribuido bajo Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0
Revisión científica:	si
Versión del editor:	https://doi.org/10.26342/2023-70-17
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 70 (2023) INV - GPLSI - Artículos de Revistas

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_70_17.pdf		1,1 MB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo

Este ítem está licenciado bajo Licencia Creative Commons