Mostrar el registro sencillo del ítem
| dc.contributor.advisor | Calonge Cano, Teodoro | es |
| dc.contributor.author | Carbajo Valor, Ismael | |
| dc.contributor.editor | Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid | es |
| dc.date.accessioned | 2025-11-04T09:54:46Z | |
| dc.date.available | 2025-11-04T09:54:46Z | |
| dc.date.issued | 2025 | |
| dc.identifier.uri | https://uvadoc.uva.es/handle/10324/79223 | |
| dc.description.abstract | La aplicación de modelos de Aprendizaje Automático en el ámbito de la Medicina, ha demostrado un gran potencial en tareas de diagnóstico y clasificación de imágenes. En este Trabajo de Fin de Grado, se ha explorado el uso de arquitecturas Vision Transformer (ViT), un enfoque relativamente reciente que ha mostrado resultados prometedores en Visión Artificial como alternativa a las tradicionales Redes Neuronales Convolucionales (CNN). El objetivo principal ha sido desarrollar e implementar un sistema de clasificación de imágenes médicas basado en ViT, evaluando su rendimiento sobre tres conjuntos de datos distintos: radiografías de tórax, resonancias magnéticas cerebrales (MRI) y tomografías de coherencia óptica (OCT). Para ello, se han desarrollado desde cero diversas variantes de modelos ViT, incorporando diferentes técnicas. Cada uno de estos modelos cuenta con mapas de explicabilidad a través de ViT-ReciproCAM. En cuanto a los resultados, se ha observado una mejora notable respecto a modelos previos en uno de los tres conjuntos de datos. Sin embargo, en los otros dos conjuntos, no se han obtenido resultados superiores a los logrados con enfoques basados en CNN, principalmente debido a las dificultades de generalización que presentan los ViT en situaciones de muestras limitadas. | es |
| dc.description.abstract | Machine Learning applied to Medicine has shown great potential in diagnosis and image classification tasks. In this Double Degree Thesis has been explored the use of Vision Transformer (ViT) architectures, a relatively recent approach that has demonstrated promising results in Computer Vision as an alternative to traditional Convolutional Neural Networks (CNNs). The main goal of this work has been to develop and implement a medical image classification system based on ViT, evaluating its performance on three different datasets: chest X-rays, brain magnetic resonance imaging (MRI) and optical coherence tomography scans (OCT). To do that, several ViT model variants have been developed from scratch. Each of these models includes explainability maps using ViT-ReciproCAM. Regarding the results, a significant improvement was observed in just one of the related datasets. However, for the other ones, the results are not bigger than those achieved with CNN-based approaches. It is mainly because ViT models with an insufficient number of samples present serious limitations due to a reduced power of generalization in practice. | es |
| dc.description.sponsorship | Departamento de Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia Artificial, Lenguajes y Sistemas Informáticos) | es |
| dc.format.mimetype | application/pdf | es |
| dc.language.iso | spa | es |
| dc.rights.accessRights | info:eu-repo/semantics/openAccess | es |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
| dc.subject.classification | Aprendizaje profundo | es |
| dc.subject.classification | Vision Transformer | es |
| dc.subject.classification | Clasificación de imágenes médicas (CXR, MRI, OCT) | es |
| dc.subject.classification | ViT-ReciproCAM | es |
| dc.title | Estudio comparativo de clasificación de imágenes médicas, usando técnicas de Inteligencia Artificial basadas en Transformers, frente a Redes Convolucionales | es |
| dc.type | info:eu-repo/semantics/bachelorThesis | es |
| dc.description.degree | Grado en Ingeniería Informática | es |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | * |
Ficheros en el ítem
Este ítem aparece en la(s) siguiente(s) colección(ones)
- Trabajos Fin de Grado UVa [33761]
La licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional




