Text categorization using bibliographic records : beyond document content

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/1306
Información del item - Informació de l'item - Item information
Título: Text categorization using bibliographic records : beyond document content
Autor/es: Montejo Ráez, Arturo | Ureña López, Luis Alfonso | Steinberger, Ralf
Palabras clave: Clasificación automática de documentos | Aprendizaje automático | Bibliotecas digitales | Text categorization | Machine learning | Digital libraries
Fecha de publicación: sep-2005
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: MONTEJO RÁEZ, Arturo; UREÑA LÓPEZ, Luis Alfonso; STEINBERGER, Ralf. “Text categorization using bibliographic records : beyond document content”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 119-126
Resumen: En este artículo se estudia el uso de diferentes fuentes de información para tareas de clasificación de textos. Dado el creciente número de bibliotecas digitales, se impone una revisión de la información disponible en dichas bases de datos. Se han llevado a cabo una serie de experimentos de clasificación multi-etiquetado dentro del dominio de la Física de Altas Energías haciendo uso de diferentes clasificadores base y combinando distintas fuentes de información. Los resultados muestran que el uso de metadatos es tan válido como el uso de versiones a texto completo de los documentos. | This paper studies the use of different sources of information for performing a text classification task. The growing number of digital libraries imposes a review of the available data from those databases. Some experiments applying different base classifiers for a multi-label classifier in the domain of High Energy Physics on several of these possible sources have been carried out. Results show that the use of metadata is almost as good as the full-text version of papers.
Patrocinador/es: This work is partially financed by the Spanish Minister of Science and Technology, by means of project TIC2003- 07158-C04-04.
URI: http://hdl.handle.net/10045/1306
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_35_15.pdf232,65 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.