Clasificación de textos adaptada para conversión de texto en habla multidominio

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/3306
Información del item - Informació de l'item - Item information
Title: Clasificación de textos adaptada para conversión de texto en habla multidominio
Authors: Alías Pujol, Francesc | Gonzalvo Fructuoso, Xavier | Sevillano Domínguez, Xavier | Socoró Carrié, Joan Claudi | Montero Morales, José Antonio | García, David
Keywords: Clasificación de textos | Textos cortos | Coste computacional | Conversión texto-habla | Text classification | Small texts | Computational cost | Text-to-speech synthesis
Issue Date: Sep-2006
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: ALÍAS PUJOL, Francesc, et al. "Clasificación de textos adaptada para conversión de texto en habla multidominio". Procesamiento del lenguaje natural. N. 37 (sept. 2006). ISSN 1135-5948, pp. 267-274
Abstract: En este trabajo se presenta un sistema de clasificación de textos adaptado a las necesidades que plantea la conversión de texto en habla multidominio. Este sistema, que es una evolución de una propuesta anterior basada en la representación de los textos mediante un grafo de nodos ponderados, ha sido desarrollado para mejorar la eficiencia de clasificación de textos cortos, así como para minimizar el coste computacional de la misma. Para ello, se trabaja sobre el espacio de comparación definido por el texto a clasificar en lugar de utilizar el construido a partir de los documentos de entrenamiento. Los experimentos de clasificación desarrollados sobre un corpus de textos publicitarios muestran la consecución de los objetivos planteados. | This paper introduces a text classification system tuned to cope with the requirements of multi-domain text-to-speech synthesis. This method, based on a previous system which represents texts by means of a weighted graph, has been developed to improve the classification efficiency for small texts and to minimize its computational cost. To that effect, the comparison space is built from the input text instead of being built from the training documents. Classification experiments conducted on an advertising text corpus show the achievement of the posed goals.
Sponsor: Trabajo financiado en parte por el proyecto IntegraTV-4all (FIT-350301-2004-2) del MCyT.
URI: http://hdl.handle.net/10045/3306
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Appears in Collections:Revistas - Procesamiento del Lenguaje Natural - Nº 37 (septiembre 2006)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_37_33.pdf248,49 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.