Estrategias de generación y reducción de variantes de pronunciación en sistemas de reconocimiento automático de habla : consideraciones arquitecturales

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1495
Registro completo de metadatos
Registro completo de metadatos
Campo DCValorIdioma
dc.contributor.authorMacías Guarasa, Javier-
dc.contributor.authorFerreiros López, Javier-
dc.contributor.authorCórdoba Herralde, Ricardo de-
dc.contributor.authorMontero Martínez, Juan Manuel-
dc.contributor.authorRomeral Martín, José David-
dc.contributor.authorPardo Muñoz, José Manuel-
dc.date.accessioned2007-09-05T09:48:14Z-
dc.date.available2007-09-05T09:48:14Z-
dc.date.issued2003-09-
dc.identifier.citationMACÍAS GUARASA, Javier, et al. “Estrategias de generación y reducción de variantes de pronunciación en sistemas de reconocimiento automático de habla : consideraciones arquitecturales”. Procesamiento del lenguaje natural. Nº 31 (septiembre 2003), pp. 91-98en
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/1495-
dc.description.abstractEn el contexto de sistemas de reconocimiento de habla de gran vocabulario es fundamental modelar de forma adecuada las variaciones alofónicas con las que se enfrentará el sistema en una tarea real. En esta comunicación describimos un estudio sobre la introducción de variantes de pronunciación dirigidas por datos, abordando tanto los procesos de generación y reducción de las mismas como los de evaluación de su impacto en la tasa del sistema. Las técnicas descritas se acompañan del correspondiente trabajo experimental, sobre dos sistemas radicalmente distintos en relación a su potencia de discriminación (basados en arquitecturas integrada y no integrada, pensadas para trabajar como módulos de hipótesis y verificación, respectivamente), de modo que es posible obtener conclusiones razonadas sobre el funcionamiento de cada uno de ellos en relación al incremento del tamaño de los diccionarios. Los resultados más relevantes muestran cómo, para el caso de la arquitectura no integrada es posible incrementar notablemente su tasa de inclusión, incluso para incrementos muy importantes del tamaño del diccionario (de hasta un 250%). Por el contrario, el incremento del número de variaciones tiene un efecto claramente negativo, cuando se utiliza el sistema integrado.en
dc.description.abstractIn the context of large vocabulary speech recognition systems, it is crucial to accurately model the allophonic variations that will be found in a real world task. In this paper we describe a study on the use of data driven pronunciation variations, considering the generation and reduction strategies, as well as their impact in the system performance. The described techniques are supported by the corresponding experimental evaluation on two radically different systems in what respect to their discrimination power (based on integrated and non-integrated architectures, designed to work as hypothesis and verification modules, respectively), so that it’s possible to discuss on their relative performance as a function of the increase in dictionary size. The most relevant results show that in the case of the non integrated architecture, we can significantly improve the inclusion rate, even for huge increases in dictionary size (up to 250%). On the contrary, the increase in the number of pronunciation variants has a clearly negative effect when applied to the integrated system.en
dc.languagespaen
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturalen
dc.relation.ispartofProcesamiento del lenguaje natural, nº 31 (septiembre 2003); pp. 91-98en
dc.subjectMúltiples pronunciacionesen
dc.subjectReconocimiento automático del hablaen
dc.subjectTécnicas dirigidas por datosen
dc.subjectArquitecturas para reconocimiento del hablaen
dc.subjectMultiple pronunciationsen
dc.subjectSpeech recognitionen
dc.subjectData driven techniquesen
dc.subjectSpeech recognition architecturesen
dc.titleEstrategias de generación y reducción de variantes de pronunciación en sistemas de reconocimiento automático de habla : consideraciones arquitecturalesen
dc.typeinfo:eu-repo/semantics/articleen
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 31 (septiembre 2003)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_31_11.pdf281,79 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.