Optimización y Procesamiento Inteligente de Grandes Volúmenes de Datos Categóricos
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/95548
Título: | Optimización y Procesamiento Inteligente de Grandes Volúmenes de Datos Categóricos |
---|---|
Autor/es: | Salvador, Jaime |
Director de la investigación: | Garcia-Rodriguez, Jose |
Centro, Departamento o Servicio: | Universidad de Alicante. Departamento de Tecnología Informática y Computación | Universidad de Alicante. Instituto Universitario de Investigación Informática |
Palabras clave: | Big Data | Aprendizaje automático | Compresión | BLAS | KNN |
Área/s de conocimiento: | Arquitectura y Tecnología de Computadores |
Fecha de creación: | 2019 |
Fecha de publicación: | 2019 |
Fecha de lectura: | 11-jun-2019 |
Editor: | Universidad de Alicante |
Resumen: | El algoritmo de clasificación kNN (k-nearest neighbors) es uno de los métodos de clasificación no paramétrico más utilizados, sin embargo, está limitado debido al consumo de memoria relacionado con el tamaño del conjunto de datos, lo que hace poco práctica su aplicación a grandes volúmenes de datos. La investigación descrita en esta tesis fue motivada por la necesidad de una representación óptima de datos categóricos que puedan ser fácilmente incorporados en los algoritmos de aprendizaje automático que permiten un análisis y explotación inteligente de grandes volúmenes de datos. En esta tesis se propone el uso de un esquema de compresión a nivel de bits para comprimir el conjunto de datos de entrenamiento (training dataset) antes de entrenar un modelo de aprendizaje automático. Para utilizar el conjunto de datos, se propuso una descompresión en tiempo real que permite el uso del conjunto de datos sin necesidad de una descompresión completa. Para facilitar la incorporación del método de compresión propuesto en los frameworks de aprendizaje automático existentes, el método propuesto está alineado con el estándar Basic Linear Algebra Subprograms - BLAS de nivel 1 que define los bloques de construcción básicos en forma de funciones algebraicas. En particular, en esta tesis se propone el uso del algoritmo kNN para trabajar con datos categóricos comprimidos. El método propuesto permite mantener los datos comprimidos en memoria, con lo que se reduce drásticamente el consumo de memoria. |
URI: | http://hdl.handle.net/10045/95548 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/doctoralThesis |
Derechos: | Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 |
Aparece en las colecciones: | Tesis doctorales |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
tesis_jaime_oswaldo_salvador_meneses.pdf | 1,56 MB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.