Análisis y síntesis de expresión emocional en cuentos leídos en voz alta

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/1327
Información del item - Informació de l'item - Item information
Títol: Análisis y síntesis de expresión emocional en cuentos leídos en voz alta
Autors: Francisco Gilmartín, Virginia | Gervás Gómez-Navarro, Pablo | Hervás Ballesteros, Raquel
Paraules clau: Síntesis de voz | Emoción | Análisis de emociones | Evaluación | Voice synthesis | Emotion | Analysis of emotions | Test
Data de publicació: de setembre-2005
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: FRANCISCO GILMARTÍN, Virginia; GERVÁS GÓMEZ-NAVARRO, Pablo; HERVÁS BALLESTEROS, Raquel. “Análisis y síntesis de expresión emocional en cuentos leídos en voz alta”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 293-300
Resum: Un reto importante para los conversores texto-voz es conseguir que la voz sintética suene lo mas parecido posible a la voz humana. La voz generada por estos sistemas actualmente suena artificial y esta es la principal causa de rechazo por parte del público general. Para conseguir que el sintetizador aparente “vida” interesa generar voz con distintos estados anímicos. El desafío fundamental de la generación de voz emocional es tratar de generar una emoción suficientemente clara para que no haya confusión en el oyente. Existen muchas teorías para definir una escala emocional. La elección de una escala concreta determina las emociones que se pretenden distinguir. Otro desafío importante es analizar las características acústicas de los distintos estados emocionales para intentar posteriormente regenerar las mismas a través del sintetizador (Montero, 2003). Este trabajo se plantea explorar la viabilidad de modelar las cadencias propias de la narración de historias a través de los parámetros de control de un conversor texto-voz. Para lograr estos parámetros se realizará un análisis de material de audio emocional y una vez modeladas cada una de las emociones se realizará una evaluación del material obtenido. | An important challenge for text-to-speech is to get a synthesized voice that sounds as like as possible to the human voice. The voice synthesized by these systems sounds artificial and this is the most principal cause of rejection by the public at the moment. In order to obtain a lively synthesized voice it is necessary to generate a voice with emotions. The main goal of the generation of emotional voice is try to generate an emotion so clear that there will be no confusion in the listener. There are a lot of theories in order to define an emotional scale. The choice of a specific scale determines the emotions that we try to distinguish. Another important challenge is analyse the acoustic characteristics at different emotional states in order to try to regenerate the same characteristics by the synthesizer (Montero, 2003). This project raises to explorer the possibility of model the lack of the tales through control parameters in the synthesizer. In order to obtain these parameters we have to carry out an analysis of emotional audio and then, once we have obtained a model, we have carried out a test.
URI: http://hdl.handle.net/10045/1327
ISSN: 1135-5948
Idioma: spa
Tipus: info:eu-repo/semantics/article
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_35_36.pdf176,34 kBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.