Oversampling imbalanced data in the string space

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/72581
Información del item - Informació de l'item - Item information
Títol: Oversampling imbalanced data in the string space
Autors: Castellanos, Francisco J. | Valero Mas, José Javier | Calvo-Zaragoza, Jorge | Rico Juan, Juan Ramón
Grups d'investigació o GITE: Reconocimiento de Formas e Inteligencia Artificial
Centre, Departament o Servei: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Paraules clau: Class imbalance problem | Oversampling | String space | SMOTE
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: 1-de febrer-2018
Editor: Elsevier
Citació bibliogràfica: Pattern Recognition Letters. 2018, 103: 32-38. doi:10.1016/j.patrec.2018.01.003
Resum: Imbalanced data is a typical problem in the supervised classification field, which occurs when the different classes are not equally represented. This fact typically results in the classifier biasing its performance towards the class representing the majority of the elements. Many methods have been proposed to alleviate this scenario, yet all of them assume that data is represented as feature vectors. In this paper we propose a strategy to balance a dataset whose samples are encoded as strings. Our approach is based on adapting the well-known Synthetic Minority Over-sampling Technique (SMOTE) algorithm to the string space. More precisely, data generation is achieved with an iterative approach to create artificial strings within the segment between two given samples of the training set. Results with several datasets and imbalance ratios show that the proposed strategy properly deals with the problem in all cases considered.
Patrocinadors: This work was partially supported by the Spanish Ministerio de Economía y Competitividad through Project TIMuL (No. TIN2013- 48152-C2-1-R supported by EU FEDER funds), the Universidad de Alicante through the FPU program (UAFPU2014–5883) and grant GRE-16-04 .
URI: http://hdl.handle.net/10045/72581
ISSN: 0167-8655 (Print) | 1872-7344 (Online)
DOI: 10.1016/j.patrec.2018.01.003
Idioma: eng
Tipus: info:eu-repo/semantics/article
Drets: © 2018 Elsevier B.V.
Revisió científica: si
Versió de l'editor: http://dx.doi.org/10.1016/j.patrec.2018.01.003
Apareix a la col·lecció: INV - GRFIA - Artículos de Revistas

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
Thumbnail2018_Castellanos_etal_PatternRecognLett_final.pdfVersión final (acceso restringido)716,98 kBAdobe PDFObrir     Sol·licitar una còpia
Thumbnail2018_Castellanos_etal_PatternRecognLett_accepted.pdfEmbargo 24 meses (acceso abierto: 6 en. 2020)313,42 kBAdobe PDFObrir     Sol·licitar una còpia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.