Por favor, use este identificador para citar o enlazar este ítem:https://uvadoc.uva.es/handle/10324/62935
Título
Redes convolucionales 2D en Pytorch : clasificación de imágenes de TAC de retina (OCT)
Autor
Director o Tutor
Año del Documento
2023
Titulación
Grado en Ingeniería Informática
Resumen
En la actualidad, los progresos en el campo de la Inteligencia Artificial han destacado
enormemente, abriendo la discusión sobre su impacto en diferentes sectores. Particularmente,
el sanitario puede beneficiarse en gran medida de estas tecnologías, que tienen el
potencial de facilitar la detección precoz de enfermedades, agilizar las tareas médicas y
mejorar la precisión de los diagnósticos.
El presente Trabajo de Fin de Grado, explora el área de la Visión por Computador,
proponiendo un sistema de diagnóstico de enfermedades retinianas a partir de imágenes
de secciones transversales de Tomografías de Coherencia Óptica (OCT). Dentro de la Medicina
Oftalmológica, las OCT permiten a los profesionales de la salud una visualización
de alta resolución de las capas y estructura internas de la retina, lo cual facilita el diagnóstico
de anomalías presentes. Sin embargo, esta tarea resulta especialmente laboriosa,
y puede estar sujeta a errores humanos.
En este estudio, se presenta el marco teórico y práctico para el desarrollo de un clasificador
de imágenes OCT, utilizando técnicas de Aprendizaje Profundo, específicamente,
Redes Neuronales Convolucionales. El modelo propuesto alcanza una precisión superior
al 96 % en la clasificación de imágenes OCT no presentadas previamente al sistema; no
obstante, es importante destacar que los diagnósticos ofrecidos no han de considerarse
definitivos, pues para obtener la máxima fiabilidad de estos, es necesaria la intervención
humana. Para ello, el trabajo realizado se ha complementado con la implementación
de Grad-CAM, un algoritmo que produce una visualización justificatoria del diagnóstico
ofrecido por el sistema, lo cual resulta de gran utilidad para la interpretación de los
resultados.
Como culmen de este proyecto, se desarrolla una aplicación web, que permite utilizar
de forma sencilla e intuitiva el sistema de diagnóstico. Nowadays, Artificial Intelligence (AI) has experienced significant development increase,
leading to the discussion of its potential across worldwide technologies. One of the
most emerging fields AI has been applied to is Biomedicine, in order to facilitate early
disease detection, obtain more efficient treatments and enhance diagnostic accuracy.
A Computer Vision system for retinal disease recognition using Optical Coherence
Tomography (OCT) cross-sectional images is proposed. More precisely, a Convolutional
Neural Network image classifier has been implemented. The model has been trained with a
dataset composed of more than 85, 000 OCT examples distributed across four categories:
Choroidal Neovascularization (CNV), Diabetic Macular Edema (DME), DRUSEN and
NORMAL.
A Hold-Out methodology with validation set has been used during the training and
evaluation of the proposed system. The final results show an impressive performance, with
an accuracy surpassing 96 % in categorizing never presented OCT images. In addition,
an explainability study has been performed with the incorporation of Grad-CAM. This
algorithm generates attention maps which highlight the most relevant areas to achieve
the classification task.
The culmination of this project is the creation of a user-friendly web application,
specifically designed to allow the use of the diagnostic system in a simple and intuitive
way.
Palabras Clave
Deep Learning
OCT
PyTorch
Machine Learning
Departamento
Departamento de Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia Artificial, Lenguajes y Sistemas Informáticos)
Idioma
spa
Derechos
openAccess
Aparece en las colecciones
- Trabajos Fin de Grado UVa [30023]
Ficheros en el ítem
La licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional