Estimación de profundidad monocular online con Transformers eficientes

Sánchez Brizuela, Guillermo

Título

dc.contributor.advisor	Bregón Bregón, Aníbal	es
dc.contributor.author	Sánchez Brizuela, Guillermo
dc.contributor.editor	Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid	es
dc.date.accessioned	2022-11-22T16:02:38Z
dc.date.available	2022-11-22T16:02:38Z
dc.date.issued	2022
dc.identifier.uri	https://uvadoc.uva.es/handle/10324/57345
dc.description.abstract	La estimación de profundidad monocular consiste en recuperar automáticamente una aproximación de la dimensión perdida al proyectar una escena tridimensional en una imagen bidimensional. Este problema tiene infinitas soluciones geométricas, por lo que es prácticamente imposible resolverlo con técnicas de visión artificial tradicional. Sin embargo, las técnicas de Deep Learning son capaces de extraer distintas características de las imágenes que permiten aproximar una solución. En este trabajo se estudia este problema y las soluciones existentes, especialmente aquellas basadas en Transformers y aprendizaje supervisado. En una de estas soluciones, se llevan a cabo una serie de modificaciones y desarrollos que permiten reducir el tamaño del modelo original y multiplicar por cerca de cinco su velocidad de inferencia. Además, se incluye un estudio exhaustivo, tanto cuantitativo como cualitativo, de la influencia de las modificaciones evaluando los modelos en el conjunto de datos KITTI, orientado a conducción autónoma.	es
dc.description.abstract	Monocular depth estimation deals with the automatic recovery of an approximation of the dimension that is lost when projecting a three-dimensional scene into a two-dimensional image. This problem has an infinite number of geometric solutions, which makes it practically impossible to solve using traditional computer vision techniques. Nonetheless, Deep Learning techniques are capable of extracting different characteristics from the images that make it possible to approximate a solution. In this work this problem and the existing solutions are studied, especially those based on Transformers and supervised learning. In one of these solutions, a series of modifications and developments are carried out to reduce the size of the original model and multiply its inference speed by nearly five. Furthermore, an exhaustive study, both quantitative and qualitative, of the influence of the different modifications is included, evaluating the models in the KITTI dataset, oriented to autonomous driving.	es
dc.description.sponsorship	Departamento de Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia Artificial, Lenguajes y Sistemas Informáticos)	es
dc.format.mimetype	application/pdf	es
dc.language.iso	spa	es
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject.classification	Estimación de profundidad monocular	es
dc.subject.classification	Transformers	es
dc.subject.classification	Deep Learning	es
dc.title	Estimación de profundidad monocular online con Transformers eficientes	es
dc.type	info:eu-repo/semantics/masterThesis	es
dc.description.degree	Máster en Ingeniería Informática	es
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 Internacional	*

Ficheros en el ítem

Nombre:: TFM-G1631.pdf
Tamaño:: 24.23Mb
Formato:: PDF

Visualizar/Abrir

Este ítem aparece en la(s) siguiente(s) colección(ones)

Trabajos Fin de Máster UVa [7003]

Mostrar el registro sencillo del ítem

La licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional