New advances in cross-task and speaker adaptation for air traffic control tasks

Córdoba Herralde, Ricardo de; Macías Guarasa, Javier; Sama Rojo, Valentín; Barra Chicote, Roberto; Pardo Muñoz, José Manuel

New advances in cross-task and speaker adaptation for air traffic control tasks

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1264

Información del item - Informació de l'item - Item information
Título:	New advances in cross-task and speaker adaptation for air traffic control tasks
Autor/es:	Córdoba Herralde, Ricardo de \| Macías Guarasa, Javier \| Sama Rojo, Valentín \| Barra Chicote, Roberto \| Pardo Muñoz, José Manuel
Palabras clave:	Adaptación a tarea \| Adaptación a locutor \| Reconocimiento del habla \| MAP \| MLLR \| Cross-task adaptation \| Speaker adaptation \| Speech recognition
Fecha de publicación:	sep-2005
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	CÓRDOBA HERRALDE, Ricardo de, et al. “New advances in cross-task and speaker adaptation for air traffic control tasks”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 21-27
Resumen:	En este artículo exploramos diversas opciones para la adaptación a tarea en reconocimiento de habla y las comparamos con desarrollar el sistema nuevo desde cero. Comparamos adaptación a tarea mediante MAP y MLLR, y ambas en serie, en dos reconocedores de habla para tareas de control del tráfico aéreo, una para habla espontánea y la otra para una interfaz de comandos. Vamos a mostrar cómo MLLR puede incluso superar a MAP cuando se utilizan un número elevado de transformadas, cómo MLLR seguido de MAP es la mejor opción, y también vamos a proporcionar varias pistas de cuáles son las mejores opciones para la creación de los árboles de clases de regresión utilizados en MLLR. En todos los casos, demostramos la efectividad de la adaptación conjunta de medias y varianzas. Para la interfaz de comandos, también incluimos la comparación entre MAP y MLLR para adaptación a locutor utilizando una cantidad variable de datos de adaptación. \| In this paper we explore several options for cross-task adaptation in speech recognition and compare them to develop the new system from scratch. We compare cross-task MAP and MLLR adaptation, and both of them together, in two speech recognizers for air traffic control tasks, one for spontaneous speech and the other one for a command interface. We show how MLLR can even outperform MAP when a big number of transforms is used, how MLLR followed by MAP is the best option, and we also provide some hints of which are the best options to create the MLLR regression class trees. In all cases, we show the effectiveness of means and variance adaptation. For the command interface, we also include the comparison between MAP and MLLR for speaker adaptation using a variable amount of adaptation data.
Patrocinador/es:	This work has been partially funded by the Spanish Ministry of Science and Technology under contracts DPI2001-3652-C02-02 (URBANO-IVANHOE), TIC2003-09192-C11-07 (MIDAS-INAUDITO), and DPI2004-07908-C02-02 (ROBINT).
URI:	http://hdl.handle.net/10045/1264
ISSN:	1135-5948
Idioma:	eng
Tipo:	info:eu-repo/semantics/article
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_35_03.pdf		142,88 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo