Optimización y Procesamiento Inteligente de Grandes Volúmenes de Datos Categóricos

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/95548
Información del item - Informació de l'item - Item information
Title: Optimización y Procesamiento Inteligente de Grandes Volúmenes de Datos Categóricos
Authors: Salvador, Jaime
Research Director: Garcia-Rodriguez, Jose
Center, Department or Service: Universidad de Alicante. Departamento de Tecnología Informática y Computación | Universidad de Alicante. Instituto Universitario de Investigación Informática
Keywords: Big Data | Aprendizaje automático | Compresión | BLAS | KNN
Knowledge Area: Arquitectura y Tecnología de Computadores
Date Created: 2019
Issue Date: 2019
Date of defense: 11-Jun-2019
Publisher: Universidad de Alicante
Abstract: El algoritmo de clasificación kNN (k-nearest neighbors) es uno de los métodos de clasificación no paramétrico más utilizados, sin embargo, está limitado debido al consumo de memoria relacionado con el tamaño del conjunto de datos, lo que hace poco práctica su aplicación a grandes volúmenes de datos. La investigación descrita en esta tesis fue motivada por la necesidad de una representación óptima de datos categóricos que puedan ser fácilmente incorporados en los algoritmos de aprendizaje automático que permiten un análisis y explotación inteligente de grandes volúmenes de datos. En esta tesis se propone el uso de un esquema de compresión a nivel de bits para comprimir el conjunto de datos de entrenamiento (training dataset) antes de entrenar un modelo de aprendizaje automático. Para utilizar el conjunto de datos, se propuso una descompresión en tiempo real que permite el uso del conjunto de datos sin necesidad de una descompresión completa. Para facilitar la incorporación del método de compresión propuesto en los frameworks de aprendizaje automático existentes, el método propuesto está alineado con el estándar Basic Linear Algebra Subprograms - BLAS de nivel 1 que define los bloques de construcción básicos en forma de funciones algebraicas. En particular, en esta tesis se propone el uso del algoritmo kNN para trabajar con datos categóricos comprimidos. El método propuesto permite mantener los datos comprimidos en memoria, con lo que se reduce drásticamente el consumo de memoria.
URI: http://hdl.handle.net/10045/95548
Language: spa
Type: info:eu-repo/semantics/doctoralThesis
Rights: Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0
Appears in Collections: Doctoral theses

Files in This Item:
Files in This Item:
File Description SizeFormat 
Thumbnailtesis_jaime_oswaldo_salvador_meneses.pdf1,56 MBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.