Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/14726
Información del item - Informació de l'item - Item information
Títol: Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla
Títol alternatiu: A semi-supervised learning method for semantic modeling in language understanding
Autors: Ortega Álvarez, Lucía | Galiano Ronda, Isabel Remedios | Hurtado Oliver, Lluís Felip | Sanchis Arnal, Emilio | Segarra Soriano, Encarnación
Paraules clau: Comprensión del habla | Clasificación semántica | Modelización estadística | Spoken language understanding | Semantic classification | Statistical modelization
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: d’octubre-2010
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: ORTEGA ÁLVAREZ, Lucía, et al. “Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla”. Procesamiento del Lenguaje Natural. N. 45 (2010). ISSN 1135-5948
Resum: En este artículo presentamos un algoritmo para el aprendizaje estadístico de modelos semánticos, a partir de un corpus no alineado de pares de frases y su representación semántica en términos de frames. El objetivo final es poder asociar automáticamente segmentos de longitud variable con sus correspondientes unidades semánticas para ser usados en tareas de comprensión de habla. Una de las ventajas de esta aproximación consiste en evitar el costoso trabajo de segmentar y etiquetar todo el corpus de aprendizaje, como necesitan la mayor parte de los métodos basados en corpus. Por otra parte, resulta de especial interés la capacidad de aprendizaje discriminativo que presenta este método. Hemos aplicado este algoritmo al desarrollo del módulo de comprensión de un sistema de diálogo hablado, cuya tarea es el acceso a información sobre trenes. Se presentan experimentos que confirman lo adecuado del método, dado el ahorro de esfuerzo en la preparación del corpus. | In this paper we present a algorithm for the statistical learning of semantic models, based on a corpus of unaligned pairs of sentences and semantic representations in terms of frames. The objective is automatically associate variable-length segments with their corresponding semantic labels to be used in speech understanding tasks. One advantage of this approach is to avoid the expensive work of segmenting and labeling the whole training corpus, process which is needed by almost all the corpus based methods. Moreover, the discrimination learning ability of this method is specially interesting. We have applied this algorithm to the development of the understanding module of a spoken dialog system, whose task is the access to information about trains. We present experiments that confirm the appropriateness of the methodology.
Patrocinadors: Trabajo parcialmente subvencionado por el gobierno español con el proyecto TIN2008-06856-C05-02.
URI: http://hdl.handle.net/10045/14726
ISSN: 1135-5948
Idioma: spa
Tipus: info:eu-repo/semantics/article
Revisió científica: si
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 45 (2010)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_45_24.pdf113,48 kBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.