Binary classifiers versus AdaBoost for labeling of digital documents

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/3341
Registro completo de metadatos
Registro completo de metadatos
Campo DCValorIdioma
dc.contributor.authorMontejo Ráez, Arturo-
dc.contributor.authorUreña López, Luis Alfonso-
dc.date.accessioned2007-11-28T16:35:28Z-
dc.date.available2007-11-28T16:35:28Z-
dc.date.issued2006-09-
dc.identifier.citationMONTEJO RÁEZ, Arturo; UREÑA LÓPEZ, Luis Alfonso. "Binary classifiers versus AdaBoost for labeling of digital documents". Procesamiento del lenguaje natural. N. 37 (sept. 2006). ISSN 1135-5948, pp. 319-326en
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/3341-
dc.description.abstractLa asignación de términos de un vocabulario controlado (habitualmente un tesauro) a documentos en formato digital está abriendo la puerta a nuevas aplicaciones. En este artículo se comparan dos algoritmos avanzados para clasificación de documentos: la selección adaptativa de clasificadores base binarios y el algoritmo AdaBoost. Si bien ambos mostraron tiempos de respuesta similares, el primero proporcionó los mejores resultados sobre la partición hep-ex del corpus HEP, respaldando dicho método como una solución robusta al multi-etiquetado para grandes colecciones.en
dc.description.abstractAssignment of labels from a controlled set of terms (usually a thesaurus) to digital version of documents is opening a wide range of new applications, now becoming powerful tools for digital libraries. In this paper we compare two different and advanced approaches for multi-label text categorization: the adaptive selection of binary base classifiers and the AdaBoost algorithm. Though both of them showed similar response times on producing final labels, the use of adaptive selection of binary classifiers performed better than AdaBoost on the hep-ex partition of the HEP corpus, confirming this method as a robust solution for multi-label of large collections.en
dc.description.sponsorshipThis work has been partially supported by the Spanish Government under project R2D2-RIM (TIC2003-07158-C04-04).en
dc.languageengen
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturalen
dc.relation.ispartofProcesamiento del lenguaje natural, nº 37 (sept. 2006), pp. 319-326en
dc.subjectClasificación automática de documentosen
dc.subjectComparación de algoritmosen
dc.subjectClasificación binariaen
dc.subjectBenchmarken
dc.subjectAutomatic text categorizationen
dc.subjectAlgorithms comparisonen
dc.subjectBinary classificationen
dc.titleBinary classifiers versus AdaBoost for labeling of digital documentsen
dc.typeinfo:eu-repo/semantics/articleen
dc.rights.accessRightsinfo:eu-repo/semantics/openAccess-
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 37 (septiembre 2006)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_37_39.pdf159,01 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.