Clasificación de textos adaptada para conversión de texto en habla multidominio
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/3306
Título: | Clasificación de textos adaptada para conversión de texto en habla multidominio |
---|---|
Autor/es: | Alías Pujol, Francesc | Gonzalvo Fructuoso, Xavier | Sevillano Domínguez, Xavier | Socoró Carrié, Joan Claudi | Montero Morales, José Antonio | García, David |
Palabras clave: | Clasificación de textos | Textos cortos | Coste computacional | Conversión texto-habla | Text classification | Small texts | Computational cost | Text-to-speech synthesis |
Fecha de publicación: | sep-2006 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | ALÍAS PUJOL, Francesc, et al. "Clasificación de textos adaptada para conversión de texto en habla multidominio". Procesamiento del lenguaje natural. N. 37 (sept. 2006). ISSN 1135-5948, pp. 267-274 |
Resumen: | En este trabajo se presenta un sistema de clasificación de textos adaptado a las necesidades que plantea la conversión de texto en habla multidominio. Este sistema, que es una evolución de una propuesta anterior basada en la representación de los textos mediante un grafo de nodos ponderados, ha sido desarrollado para mejorar la eficiencia de clasificación de textos cortos, así como para minimizar el coste computacional de la misma. Para ello, se trabaja sobre el espacio de comparación definido por el texto a clasificar en lugar de utilizar el construido a partir de los documentos de entrenamiento. Los experimentos de clasificación desarrollados sobre un corpus de textos publicitarios muestran la consecución de los objetivos planteados. | This paper introduces a text classification system tuned to cope with the requirements of multi-domain text-to-speech synthesis. This method, based on a previous system which represents texts by means of a weighted graph, has been developed to improve the classification efficiency for small texts and to minimize its computational cost. To that effect, the comparison space is built from the input text instead of being built from the training documents. Classification experiments conducted on an advertising text corpus show the achievement of the posed goals. |
Patrocinador/es: | Trabajo financiado en parte por el proyecto IntegraTV-4all (FIT-350301-2004-2) del MCyT. |
URI: | http://hdl.handle.net/10045/3306 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 37 (septiembre 2006) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_37_33.pdf | 248,49 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.