Bi-modal annoyance level detection from speech and text

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/81331
Información del item - Informació de l'item - Item information
Title: Bi-modal annoyance level detection from speech and text
Other Titles: Detección del nivel de enfado mediante un sistema bi-modal basado en habla y texto
Authors: Justo Blanco, Raquel | Irastorza, Jon | Pérez, Saioa | Torres Barañano, María Inés
Keywords: Speech processing | Semantic information | Emotion detection on speech | Annoyance tracking | Machine learning | Procesamiento del habla | Información semántica | Reconocimiento emocional en el habla | Rastreo del enfado | Aprendizaje automático
Knowledge Area: Lenguajes y Sistemas Informáticos
Issue Date: Sep-2018
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: Procesamiento del Lenguaje Natural. 2018, 61: 83-89. doi:10.26342/2018-61-9
Abstract: The main goal of this work is the identification of emotional hints from speech. Machine learning researchers have analysed sets of acoustic parameters as potential cues for the identification of discrete emotional categories or, alternatively, of the dimensions of emotions. However, the semantic information gathered in the text message associated to its utterance can also provide valuable information that can be helpful for emotion detection. In this work this information is included within the acoustic information leading to a better system performance. Moreover, it is noticeable the use of a corpus that include spontaneous emotions gathered in a realistic environment. It is well known that emotion expression depends not only on cultural factors but also on the individual and on the specific situation. Thus, the conclusions extracted from the present work can be more easily extrapolated to a real system than those obtained from a classical corpus with simulated emotions. | El principal objetivo de este trabajo es la detección de cambios emocionales a partir del habla. Diferentes trabajos basados en aprendizaje automático han analizado conjuntos de parámetros acústicos como potenciales indicadores en la identificación de categorías emocionales discretas o en la identificación dimensional de las emociones. Sin embargo, la información semántica recogida en el mensaje textual asociado a cada intervención, puede proporcionar información valiosa para la detección de emociones. En este trabajo se combina la información textual y acústica dando lugar a mejoras en el rendimiento del sistema. Es importante recalcar por otra parte, el uso de un corpus que incluye emociones espontáneas recogidas en un entorno realista. Es bien sabido que la expresión de la emoción depende no solo de factores culturales sino también de factores individuales y de situaciones particulares. Por lo tanto, las conclusiones extraídas en este trabajo se pueden extrapolar más fácilmente a un sistema real que aquellas obtenidas a partir de un corpus clásico en el que se simula el estado emocional.
URI: http://hdl.handle.net/10045/81331
ISSN: 1135-5948
DOI: 10.26342/2018-61-9
Language: eng
Type: info:eu-repo/semantics/article
Rights: © Sociedad Española para el Procesamiento del Lenguaje Natural
Peer Review: si
Publisher version: https://doi.org/10.26342/2018-61-9
Appears in Collections:Revistas - Procesamiento del Lenguaje Natural - Nº 61 (2018)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_61_09.pdf703,17 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.