RT info:eu-repo/semantics/masterThesis T1 Estimación de profundidad monocular online con Transformers eficientes A1 Sánchez Brizuela, Guillermo A2 Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid K1 Estimación de profundidad monocular K1 Transformers K1 Deep Learning AB La estimación de profundidad monocular consiste en recuperar automáticamente una aproximación de la dimensión perdida al proyectar una escena tridimensional en una imagen bidimensional. Este problema tiene infinitas soluciones geométricas, por lo que es prácticamente imposible resolverlo con técnicas de visión artificial tradicional. Sin embargo, las técnicas de Deep Learning son capaces de extraer distintas características de las imágenes que permiten aproximar una solución. En este trabajo se estudia este problema y las soluciones existentes, especialmente aquellas basadas en Transformers y aprendizaje supervisado. En una de estas soluciones, se llevan a cabo una serie de modificaciones y desarrollos que permiten reducir el tamaño del modelo original y multiplicar por cerca de cinco su velocidad de inferencia. Además, se incluye un estudio exhaustivo, tanto cuantitativo como cualitativo, de la influencia de las modificaciones evaluando los modelos en el conjunto de datos KITTI, orientado a conducción autónoma. YR 2022 FD 2022 LK https://uvadoc.uva.es/handle/10324/57345 UL https://uvadoc.uva.es/handle/10324/57345 LA spa NO Departamento de Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia Artificial, Lenguajes y Sistemas Informáticos) DS UVaDOC RD 17-jul-2024