Incorporación de n-gramas discriminativos para mejorar un reconocedor de idioma fonotáctico basado en i-vectores

Salamea Palacios, Christian; D'Haro Enríquez, Luis Fernando; Córdoba Herralde, Ricardo de; Caraballo, Miguel Ángel

Incorporación de n-gramas discriminativos para mejorar un reconocedor de idioma fonotáctico basado en i-vectores

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/30632

Información del item - Informació de l'item - Item information
Título:	Incorporación de n-gramas discriminativos para mejorar un reconocedor de idioma fonotáctico basado en i-vectores
Título alternativo:	Incorporation of discriminative n-grams to improve a phonotactic language recognizer based on i-vectors
Autor/es:	Salamea Palacios, Christian \| D'Haro Enríquez, Luis Fernando \| Córdoba Herralde, Ricardo de \| Caraballo, Miguel Ángel
Palabras clave:	Posteriorgrama \| I-vectores \| Rankings discriminativos \| Fonotáctico \| N-gramas \| Posteriorgram \| I-vectors \| Discriminate rankings \| Phonotactic \| N-grams
Área/s de conocimiento:	Lenguajes y Sistemas Informáticos
Fecha de publicación:	sep-2013
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	SALAMEA PALACIOS, Christian, et al. “Incorporación de n-gramas discriminativos para mejorar un reconocedor de idioma fonotáctico basado en i-vectores”. Procesamiento del Lenguaje Natural. N. 51 (2013). ISSN 1135-5948, pp. 145-152
Resumen:	Este artículo describe una nueva técnica que permite combinar la información de dos sistemas fonotácticos distintos con el objetivo de mejorar los resultados de un sistema de reconocimiento automático de idioma. El primer sistema se basa en la creación de cuentas de posteriorgramas utilizadas para la generación de i-vectores, y el segundo es una variante del primero que tiene en cuenta los n-gramas más discriminativos en función de su ocurrencia en un idioma frente a todos los demás. La técnica propuesta permite obtener una mejora relativa de 8.63% en Cavg sobre los datos de evaluación utilizados para la competición ALBAYZIN 2012 LRE. \| This paper describes a novel technique that allows the combination of the information from two different phonotactic systems with the goal of improving the results of an automatic language recognition system. The first system is based on the creation of posteriorgram counts used for the generation of i-vectors, and the second system is a variation of the first one that takes into account the most discriminative n-grams as a function of their occurrence in one language compared to all other languages. The proposed technique allows a relative improvement of 8.63% on Cavg over the official set used for the ALBAYZIN 2012 LRE evaluation.
Patrocinador/es:	Este trabajo ha sido posible gracias a la financiación de los siguientes proyectos: MA2VICMR (CC.AA. de Madrid, S2009/TIC-1542), y TIMPANO (TIN2011-28169-C05-03).
URI:	http://hdl.handle.net/10045/30632
ISSN:	1135-5948
Idioma:	spa
Tipo:	info:eu-repo/semantics/article
Revisión científica:	si
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 51 (2013)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_51_16.pdf		673,71 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo