When humour hurts: linguistic features to foster explainability

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/133259
Información del item - Informació de l'item - Item information
Título: When humour hurts: linguistic features to foster explainability
Título alternativo: Cuando el humor duele: características lingüísticas para ganar en explicabilidad
Autor/es: Merlo, Lucía I. | Chulvi, Berta | Ortega, Reynier | Rosso, Paolo
Palabras clave: Humour | Offensive language | Computational linguistics | Humor | Lenguaje ofensivo | Lingüística computacional
Fecha de publicación: mar-2023
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2023, 70: 85-98. https://doi.org/10.26342/2023-70-7
Resumen: The main objective of this research is to use different features for the textual representation of humorous texts and detect which are the characteristics that distinguish non-offensive jokes from the highly offensive ones. For this purpose, we use the data from the HaHackaton task in which jokes are annotated according to their degree of offensiveness. A new classification task is created by using two subsets of the jokes: the non-offensive ones and the highly offensive ones. The features with statistically significant differences in the two groups are used. By applying an ablation test, the most relevant features are used for a second classification task, showing that it is possible to obtain the same results with fewer computational resources. | El objetivo de esta investigación es utilizar distintas características para representar los textos humorísticos y detectar cuáles son las que mejor distinguen los chistes no ofensivos de los muy ofensivos. Se utiliza los datos de la tarea HaHackaton en la que los chistes están anotados según su grado de ofensa. Se diseña un nuevo problema de clasificación con dos conjuntos de chistes: los nada ofensivos y los muy ofensivos. Los clasificadores se entrenaron con las características que presentan diferencias significativas en las dos clases. Mediante la aplicación de un ablation test se identificaron las más relevantes que se han utilizado en una segunda tarea de clasificación mostrando que es posible obtener los mismos resultados con menos recursos computacionales.
Patrocinador/es: This work was done in the framework of the FairTransNLP research project (PID2021-124361OB-C31) funded by MCIN/AEI/10.13039/501100011033 and by ERDF, EU A way of making Europe. It has been developed with the support of valgrAI - Valencian Graduate School and Research Network of Artificial Intelligence and the Generalitat Valenciana, and co-funded by the European Union.
URI: http://hdl.handle.net/10045/133259
ISSN: 1135-5948
DOI: 10.26342/2023-70-7
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural. Distribuido bajo Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2023-70-7
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 70 (2023)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_70_07.pdf936,48 kBAdobe PDFAbrir Vista previa


Este ítem está licenciado bajo Licencia Creative Commons Creative Commons