Justo Blanco, Raquel, Irastorza, Jon, Pérez, Saioa, Torres Barañano, María Inés Bi-modal annoyance level detection from speech and text Procesamiento del Lenguaje Natural. 2018, 61: 83-89. doi:10.26342/2018-61-9 URI: http://hdl.handle.net/10045/81331 DOI: 10.26342/2018-61-9 ISSN: 1135-5948 Abstract: The main goal of this work is the identification of emotional hints from speech. Machine learning researchers have analysed sets of acoustic parameters as potential cues for the identification of discrete emotional categories or, alternatively, of the dimensions of emotions. However, the semantic information gathered in the text message associated to its utterance can also provide valuable information that can be helpful for emotion detection. In this work this information is included within the acoustic information leading to a better system performance. Moreover, it is noticeable the use of a corpus that include spontaneous emotions gathered in a realistic environment. It is well known that emotion expression depends not only on cultural factors but also on the individual and on the specific situation. Thus, the conclusions extracted from the present work can be more easily extrapolated to a real system than those obtained from a classical corpus with simulated emotions. El principal objetivo de este trabajo es la detección de cambios emocionales a partir del habla. Diferentes trabajos basados en aprendizaje automático han analizado conjuntos de parámetros acústicos como potenciales indicadores en la identificación de categorías emocionales discretas o en la identificación dimensional de las emociones. Sin embargo, la información semántica recogida en el mensaje textual asociado a cada intervención, puede proporcionar información valiosa para la detección de emociones. En este trabajo se combina la información textual y acústica dando lugar a mejoras en el rendimiento del sistema. Es importante recalcar por otra parte, el uso de un corpus que incluye emociones espontáneas recogidas en un entorno realista. Es bien sabido que la expresión de la emoción depende no solo de factores culturales sino también de factores individuales y de situaciones particulares. Por lo tanto, las conclusiones extraídas en este trabajo se pueden extrapolar más fácilmente a un sistema real que aquellas obtenidas a partir de un corpus clásico en el que se simula el estado emocional. Keywords:Speech processing, Semantic information, Emotion detection on speech, Annoyance tracking, Machine learning, Procesamiento del habla, Información semántica, Reconocimiento emocional en el habla, Rastreo del enfado, Aprendizaje automático Sociedad Española para el Procesamiento del Lenguaje Natural info:eu-repo/semantics/article