Comparativa de aproximaciones a SVM semisupervisado multiclase para clasificación de páginas Web

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/10546
Información del item - Informació de l'item - Item information
Títol: Comparativa de aproximaciones a SVM semisupervisado multiclase para clasificación de páginas Web
Títol alternatiu: A comparison of approaches to semi-supervised multiclass SVM for Web page classification
Autors: Zubiaga Mendialdua, Arkaitz | Fresno Fernández, Víctor | Martínez Unanue, Raquel
Paraules clau: SVM | Multiclase | Semisupervisado | Clasificación de páginas web | Multiclass | Semi-supervised | Web page classification
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: de març-2009
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: ZUBIAGA MENDIALDUA, Arkaitz; FRESNO FERNÁNDEZ, Víctor; MARTÍNEZ UNANUE, Raquel. “Comparativa de aproximaciones a SVM semisupervisado multiclase para clasificación de páginas Web”. Procesamiento del lenguaje natural. N. 42 (marzo 2009). ISSN 1135-5948, pp. 63-70
Resum: En este artículo se realiza un estudio de diferentes aproximaciones a la clasificación semisupervisada multiclase de páginas web mediante SVM. Ante la naturaleza binaria y supervisada de los algoritmos SVM clásicos, y tratando de evitar problemas de optimización complejos, se propone un enfoque basado en la combinación de clasificadores, tanto binarios semisupervisados como clasificadores multiclase supervisados. Los resultados de los experimentos realizados sobre tres colecciones de referencia muestran un rendimiento notablemente superior para la combinación de clasificadores multiclase supervisados. Por otro lado, en este trabajo también se realiza un estudio sobre la aportación de los documentos no etiquetados en la fase de aprendizaje para este tipo de entornos. En nuestro caso, y a diferencia de los problemas binarios, se obtiene una mayor efectividad cuando se ignora este tipo de datos para problemas multiclase. | In this paper we present a study on semi-supervised multiclass web page classification using SVM. Due to the binary and supervised nature of the classical SVM algorithms, and trying to avoid complex optimization problems, we propose an approach based on the combination of classifiers, not only binary semi-supervised classifiers but also multiclass supervised ones. The results of our experiments over three benchmark datasets show noticeably higher performance for the combination of multiclass supervised classifiers. On the other hand, we analyze the contribution of unlabeled documents during the learning process for these environments. In our case, and unlike for binary tasks, we get higher effectiveness for multiclass tasks when no unlabeled documents are taken into account.
URI: http://hdl.handle.net/10045/10546
ISSN: 1135-5948
Idioma: spa
Tipus: info:eu-repo/semantics/article
Revisió científica: si
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 42 (marzo 2009)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_42_08.pdf1,03 MBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.