Clasificación de textos adaptada para conversión de texto en habla multidominio

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/3306
Información del item - Informació de l'item - Item information
Título: Clasificación de textos adaptada para conversión de texto en habla multidominio
Autor/es: Alías Pujol, Francesc | Gonzalvo Fructuoso, Xavier | Sevillano Domínguez, Xavier | Socoró Carrié, Joan Claudi | Montero Morales, José Antonio | García, David
Palabras clave: Clasificación de textos | Textos cortos | Coste computacional | Conversión texto-habla | Text classification | Small texts | Computational cost | Text-to-speech synthesis
Fecha de publicación: sep-2006
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: ALÍAS PUJOL, Francesc, et al. "Clasificación de textos adaptada para conversión de texto en habla multidominio". Procesamiento del lenguaje natural. N. 37 (sept. 2006). ISSN 1135-5948, pp. 267-274
Resumen: En este trabajo se presenta un sistema de clasificación de textos adaptado a las necesidades que plantea la conversión de texto en habla multidominio. Este sistema, que es una evolución de una propuesta anterior basada en la representación de los textos mediante un grafo de nodos ponderados, ha sido desarrollado para mejorar la eficiencia de clasificación de textos cortos, así como para minimizar el coste computacional de la misma. Para ello, se trabaja sobre el espacio de comparación definido por el texto a clasificar en lugar de utilizar el construido a partir de los documentos de entrenamiento. Los experimentos de clasificación desarrollados sobre un corpus de textos publicitarios muestran la consecución de los objetivos planteados. | This paper introduces a text classification system tuned to cope with the requirements of multi-domain text-to-speech synthesis. This method, based on a previous system which represents texts by means of a weighted graph, has been developed to improve the classification efficiency for small texts and to minimize its computational cost. To that effect, the comparison space is built from the input text instead of being built from the training documents. Classification experiments conducted on an advertising text corpus show the achievement of the posed goals.
Patrocinador/es: Trabajo financiado en parte por el proyecto IntegraTV-4all (FIT-350301-2004-2) del MCyT.
URI: http://hdl.handle.net/10045/3306
ISSN: 1135-5948
Idioma: spa
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 37 (septiembre 2006)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_37_33.pdf248,49 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.