Violencia Identificada en el Lenguaje (VIL). Creación de recurso para mensajes violentos

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/133265
Full metadata record
Full metadata record
DC FieldValueLanguage
dc.contributorProcesamiento del Lenguaje y Sistemas de Información (GPLSI)es_ES
dc.contributor.authorBotella, Beatriz-
dc.contributor.authorSepúlveda-Torres, Robiert-
dc.contributor.authorMartínez-Barco, Patricio-
dc.contributor.authorSaquete Boró, Estela-
dc.contributor.otherUniversidad de Alicante. Departamento de Lenguajes y Sistemas Informáticoses_ES
dc.date.accessioned2023-03-31T15:49:34Z-
dc.date.available2023-03-31T15:49:34Z-
dc.date.issued2023-03-
dc.identifier.citationProcesamiento del Lenguaje Natural. 2023, 70: 187-198. https://doi.org/10.26342/2023-70-15es_ES
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/133265-
dc.description.abstractLa sociedad avanza cargada de conocimientos nuevos y muy accesibles, que se publican en el mundo virtual. Es una realidad que las Tecnologías de la Información y la Comunicación (TIC) han traído muchos beneficios a nuestras vidas pero también vemos como año tras año aumenta el uso de violencia en plataformas digitales. Nuestro trabajo se enfoca en la creación de recursos que permitan la detección de mensajes violentos en la red social Twitter. Se parte de la creación de una guía de anotación de grano fino para anotar un corpus de mensajes violentos (VIL) con el fin de utilizar herramientas de aprendizaje automático que nos ayuden a detectar automáticamente el problema. Con este corpus se entrenan dos modelos de lenguaje (BETO y RoBERTa base) con los que se alcanza un valor en la métrica F1m de 97.03% y 96.51% clasificando si un tuit es o no violento.es_ES
dc.description.abstractSociety is moving forward full of new and very accessible knowledge, which is published in the virtual world. It is a reality that ICTs have brought many benefits to our lives but we also see how year after year the use of violence on digital platforms increases. Our work focuses on the detection of violent messages in the social network Twitter. Starting from the creation of a fine-grained annotation guide to obtain a corpus of violent messages (VIL) in order to use Machine Learning tools that help us to automatically detect the problem Two language models are trained with this corpus (BETO and RoBERTa base) with which a value of 97.03% and 96.51% is reached in the F1m metric, classifying whether or not a tweet is violent.es_ES
dc.description.sponsorshipEsta investigación ha sido financiada por MCIN/AEI/ 10.13039/501100011033 y la Unión Europea NextGenerationEU/PRTR a través de los proyectos “TRIVIAL” (PID2021-122263OB-C22) and “SocialTrust” (PDC2022-133146-C22). También cuenta con el apoyo de la Generalitat Valenciana a través del proyecto “NL4DISMIS” (CIPROM/2021/21).es_ES
dc.languagespaes_ES
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturales_ES
dc.rights© Sociedad Española para el Procesamiento del Lenguaje Natural. Distribuido bajo Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0es_ES
dc.subjectProcesamiento Lenguaje Naturales_ES
dc.subjectGuía Anotaciónes_ES
dc.subjectAnotación Corpuses_ES
dc.subjectDetección Mensajes Violentoses_ES
dc.subjectNatural Language Processinges_ES
dc.subjectAnnotation Guidelinees_ES
dc.subjectDataset Annotationes_ES
dc.subjectDetection of Violent Messageses_ES
dc.titleViolencia Identificada en el Lenguaje (VIL). Creación de recurso para mensajes violentoses_ES
dc.title.alternativeViolence Identified in Language (VIL). Creation of a resource for the detection of violent messageses_ES
dc.typeinfo:eu-repo/semantics/articlees_ES
dc.peerreviewedsies_ES
dc.identifier.doi10.26342/2023-70-15-
dc.relation.publisherversionhttps://doi.org/10.26342/2023-70-15es_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023/PID2021-122263OB-C22es_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023/PDC2022-133146-C22es_ES
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 70 (2023)
INV - GPLSI - Artículos de Revistas

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_70_15.pdf1,04 MBAdobe PDFOpen Preview


This item is licensed under a Creative Commons License Creative Commons