Estudio y aplicación de un LLM multimodal en tareas de localización y reconocimiento de objetos

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/145413
Información del item - Informació de l'item - Item information
Title: Estudio y aplicación de un LLM multimodal en tareas de localización y reconocimiento de objetos
Authors: Ontiveros Puertas, Iván
Research Director: Cazorla, Miguel | Gomez-Donoso, Francisco
Center, Department or Service: Universidad de Alicante. Departamento de Ciencia de la Computación e Inteligencia Artificial
Keywords: Modelos de Lenguaje Grande | Robótica móvil | Reconocimiento de objetos | SLAM | Navegación autónoma | Inteligencia Artificial | Detección de objetos
Issue Date: 22-Jul-2024
Date of defense: 18-Jul-2024
Abstract: En este proyecto, se explora la aplicación de Modelos de Lenguaje Grande Multimodales (MLLMs) en el campo de la robótica, específicamente en tareas de localización y reconocimiento de objetos. La motivación principal radica en la capacidad de estos modelos para interpretar y razonar sobre datos visuales y textuales, superando las limitaciones de los métodos tradicionales de visión artificial. A lo largo del proyecto, se estudiará una arquitectura basada en LLM que aplica un proceso de búsqueda de objetos basado en una heurística, y se diseñará un prototipo de aplicación para tratar de explotar las capacidades del modelo.
URI: http://hdl.handle.net/10045/145413
Language: spa
Type: info:eu-repo/semantics/bachelorThesis
Rights: Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0
Appears in Collections:Grado en Ingeniería Robótica - Trabajos Fin de Grado

Files in This Item:


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.