Estudio y aplicación de un LLM multimodal en tareas de localización y reconocimiento de objetos
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10045/145413
Title: | Estudio y aplicación de un LLM multimodal en tareas de localización y reconocimiento de objetos |
---|---|
Authors: | Ontiveros Puertas, Iván |
Research Director: | Cazorla, Miguel | Gomez-Donoso, Francisco |
Center, Department or Service: | Universidad de Alicante. Departamento de Ciencia de la Computación e Inteligencia Artificial |
Keywords: | Modelos de Lenguaje Grande | Robótica móvil | Reconocimiento de objetos | SLAM | Navegación autónoma | Inteligencia Artificial | Detección de objetos |
Issue Date: | 22-Jul-2024 |
Date of defense: | 18-Jul-2024 |
Abstract: | En este proyecto, se explora la aplicación de Modelos de Lenguaje Grande Multimodales (MLLMs) en el campo de la robótica, específicamente en tareas de localización y reconocimiento de objetos. La motivación principal radica en la capacidad de estos modelos para interpretar y razonar sobre datos visuales y textuales, superando las limitaciones de los métodos tradicionales de visión artificial. A lo largo del proyecto, se estudiará una arquitectura basada en LLM que aplica un proceso de búsqueda de objetos basado en una heurística, y se diseñará un prototipo de aplicación para tratar de explotar las capacidades del modelo. |
URI: | http://hdl.handle.net/10045/145413 |
Language: | spa |
Type: | info:eu-repo/semantics/bachelorThesis |
Rights: | Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 |
Appears in Collections: | Grado en Ingeniería Robótica - Trabajos Fin de Grado |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
![]() | 40,06 MB | Adobe PDF | Open Preview | |
Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.