Generación y pesado de skipgrams y su aplicación al análisis de sentimientos
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/133266
Título: | Generación y pesado de skipgrams y su aplicación al análisis de sentimientos |
---|---|
Título alternativo: | Skipgrams Generation and Weighting and its Application to Sentiment Analysis |
Autor/es: | Fernández Martínez, Javier | Gutiérrez, Yoan | Martínez-Barco, Patricio |
Grupo/s de investigación o GITE: | Procesamiento del Lenguaje y Sistemas de Información (GPLSI) |
Centro, Departamento o Servicio: | Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos |
Palabras clave: | Skipgrams | Generación de términos | Pesado de términos | Análisis de sentimientos | Term generation | Term weighting | Sentiment analysis |
Fecha de publicación: | mar-2023 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | Procesamiento del Lenguaje Natural. 2023, 70: 213-223. https://doi.org/10.26342/2023-70-17 |
Resumen: | El modelado de skipgrams es una técnica para la generación de términos multi-palabra que conserva parte de la secuencialidad y flexibilidad del lenguaje. Sin embargo, en algunos casos el número de skipgrams generados puede ser excesivo a medida que se aumenta la distancia entre palabras. Además, esta distancia no suele ser tenida en cuenta a la hora de valorar los términos que se generan. En este trabajo proponemos una técnica para la generación y filtrado eficientes de skipgrams y un esquema de pesado que tiene en cuenta la distancia entre los términos, dando más importancia a aquellos más cercanos. Aplicaremos y evaluaremos estas propuestas en la tarea de análisis de sentimientos. | Skipgram modelling is a technique for generating multi-word terms that preserves some of the sequentiality and flexibility of the language. However, in some cases the number of skipgrams generated may become excessive as the distance between words increases. Moreover, this distance is often not taken into account when evaluating the terms that are generated. In this paper we propose a technique for efficient skipgram generation and filtering, and a weighing scheme that takes into account the distance between terms, giving more importance to those closer. We will apply and evaluate these proposals in the task of sentiment analysis. |
Patrocinador/es: | Esta investigación ha sido financiada por la Universidad de Alicante, el Ministerio de Ciencia e Innovación de España, la Generalitat Valenciana y el Fondo Europeo de Desarrollo Regional (FEDER) a través de la siguiente financiación: a nivel nacional, se concedieron los proyectos TRIVIAL (PID2021-122263OB-C22), Social-Trust (PDC2022-133146-C22) y CLEARTEXT (TED2021-130707B-I00), financiados por MCIN/AEI/10.13039/501100011033 y European Union NextGenerationEU/PRTR; a nivel regional, la Generalitat Valenciana (Conselleria d’Educació, Investigació, Cultura i Esport), concedió financiación para NL4DISMIS (CIPROM/2021/21). Además, contó con el apoyo de dos acciones COST: CA19134 - “Distributed Knowledge Graphs” y CA19142 - “Leading Platform for European Citizens, Industries, Academia, and Policymakers in Media Accessibility”. |
URI: | http://hdl.handle.net/10045/133266 |
ISSN: | 1135-5948 |
DOI: | 10.26342/2023-70-17 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Derechos: | © Sociedad Española para el Procesamiento del Lenguaje Natural. Distribuido bajo Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 |
Revisión científica: | si |
Versión del editor: | https://doi.org/10.26342/2023-70-17 |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 70 (2023) INV - GPLSI - Artículos de Revistas |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_70_17.pdf | 1,1 MB | Adobe PDF | Abrir Vista previa | |
Este ítem está licenciado bajo Licencia Creative Commons