Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/14726
Información del item - Informació de l'item - Item information
Title: Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla
Other Titles: A semi-supervised learning method for semantic modeling in language understanding
Authors: Ortega Álvarez, Lucía | Galiano Ronda, Isabel Remedios | Hurtado Oliver, Lluís Felip | Sanchis Arnal, Emilio | Segarra Soriano, Encarnación
Keywords: Comprensión del habla | Clasificación semántica | Modelización estadística | Spoken language understanding | Semantic classification | Statistical modelization
Knowledge Area: Lenguajes y Sistemas Informáticos
Issue Date: Oct-2010
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: ORTEGA ÁLVAREZ, Lucía, et al. “Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla”. Procesamiento del Lenguaje Natural. N. 45 (2010). ISSN 1135-5948
Abstract: En este artículo presentamos un algoritmo para el aprendizaje estadístico de modelos semánticos, a partir de un corpus no alineado de pares de frases y su representación semántica en términos de frames. El objetivo final es poder asociar automáticamente segmentos de longitud variable con sus correspondientes unidades semánticas para ser usados en tareas de comprensión de habla. Una de las ventajas de esta aproximación consiste en evitar el costoso trabajo de segmentar y etiquetar todo el corpus de aprendizaje, como necesitan la mayor parte de los métodos basados en corpus. Por otra parte, resulta de especial interés la capacidad de aprendizaje discriminativo que presenta este método. Hemos aplicado este algoritmo al desarrollo del módulo de comprensión de un sistema de diálogo hablado, cuya tarea es el acceso a información sobre trenes. Se presentan experimentos que confirman lo adecuado del método, dado el ahorro de esfuerzo en la preparación del corpus. | In this paper we present a algorithm for the statistical learning of semantic models, based on a corpus of unaligned pairs of sentences and semantic representations in terms of frames. The objective is automatically associate variable-length segments with their corresponding semantic labels to be used in speech understanding tasks. One advantage of this approach is to avoid the expensive work of segmenting and labeling the whole training corpus, process which is needed by almost all the corpus based methods. Moreover, the discrimination learning ability of this method is specially interesting. We have applied this algorithm to the development of the understanding module of a spoken dialog system, whose task is the access to information about trains. We present experiments that confirm the appropriateness of the methodology.
Sponsor: Trabajo parcialmente subvencionado por el gobierno español con el proyecto TIN2008-06856-C05-02.
URI: http://hdl.handle.net/10045/14726
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Peer Review: si
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 45 (2010)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_45_24.pdf113,48 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.