Optimización y Procesamiento Inteligente de Grandes Volúmenes de Datos Categóricos

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/95548
Información del item - Informació de l'item - Item information
Título: Optimización y Procesamiento Inteligente de Grandes Volúmenes de Datos Categóricos
Autor/es: Salvador, Jaime
Director de la investigación: Garcia-Rodriguez, Jose
Centro, Departamento o Servicio: Universidad de Alicante. Departamento de Tecnología Informática y Computación | Universidad de Alicante. Instituto Universitario de Investigación Informática
Palabras clave: Big Data | Aprendizaje automático | Compresión | BLAS | KNN
Área/s de conocimiento: Arquitectura y Tecnología de Computadores
Fecha de creación: 2019
Fecha de publicación: 2019
Fecha de lectura: 11-jun-2019
Editor: Universidad de Alicante
Resumen: El algoritmo de clasificación kNN (k-nearest neighbors) es uno de los métodos de clasificación no paramétrico más utilizados, sin embargo, está limitado debido al consumo de memoria relacionado con el tamaño del conjunto de datos, lo que hace poco práctica su aplicación a grandes volúmenes de datos. La investigación descrita en esta tesis fue motivada por la necesidad de una representación óptima de datos categóricos que puedan ser fácilmente incorporados en los algoritmos de aprendizaje automático que permiten un análisis y explotación inteligente de grandes volúmenes de datos. En esta tesis se propone el uso de un esquema de compresión a nivel de bits para comprimir el conjunto de datos de entrenamiento (training dataset) antes de entrenar un modelo de aprendizaje automático. Para utilizar el conjunto de datos, se propuso una descompresión en tiempo real que permite el uso del conjunto de datos sin necesidad de una descompresión completa. Para facilitar la incorporación del método de compresión propuesto en los frameworks de aprendizaje automático existentes, el método propuesto está alineado con el estándar Basic Linear Algebra Subprograms - BLAS de nivel 1 que define los bloques de construcción básicos en forma de funciones algebraicas. En particular, en esta tesis se propone el uso del algoritmo kNN para trabajar con datos categóricos comprimidos. El método propuesto permite mantener los datos comprimidos en memoria, con lo que se reduce drásticamente el consumo de memoria.
URI: http://hdl.handle.net/10045/95548
Idioma: spa
Tipo: info:eu-repo/semantics/doctoralThesis
Derechos: Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0
Aparece en las colecciones:Tesis doctorales

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
Thumbnailtesis_jaime_oswaldo_salvador_meneses.pdf1,56 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.