Por favor, use este identificador para citar o enlazar este ítem:https://uvadoc.uva.es/handle/10324/79548
Título
Diseño y validación de un modelo de predicción de reingreso hospitalario por exacerbación de enfermedad pulmonar obstructiva crónica mediante métodos de aprendizaje computacional
Autor
Director o Tutor
Año del Documento
2025
Titulación
Grado en Ingeniería Biomédica
Resumen
La Enfermedad Pulmonar Obstructiva Crónica (EPOC) es una patología respiratoria caracterizada por la limitación crónica al flujo aéreo, relacionada comúnmente con el hábito tabáquico. Afecta principalmente a la población mayor de 40 años y su prevalencia mundial en 2024 fue de 391 millones de personas. Según datos de la Organización Mundial de la Salud, actualmente constituye la cuarta causa de muerte en el mundo, pero se proyecta un aumento de su mortalidad para el año 2030, en el que podría ocupar el tercer puesto. Pese a la falta de consenso, las exacerbaciones pueden definirse como un aumento agudo de síntomas como disnea, tos o esputo. Sus consecuencias incluyen un empeoramiento de la función pulmonar, deterioro de la calidad de vida de los pacientes y aumento de mortalidad. Asimismo, representan una elevada carga económica y social, pero su infradiagnóstico persiste y no reciben la atención necesaria a pesar de su gran impacto. Esto subraya la necesidad de intervenciones urgentes con las que mitigar sus efectos, entre las que se encuentra la implementación de herramientas predictivas que permitan adoptar estrategias preventivas, efectuar un correcto manejo de las agudizaciones, abaratar costes y mejorar la vida de los pacientes y sus familiares.
El presente trabajo se elaboró bajo la hipótesis principal de que el desarrollo de modelos predictivos basados en técnicas de Machine Learning podría ser útil para estimar futuros reingresos por exacerbación de EPOC en los 30 días posteriores al alta. Con este fin, se esperaría que las variables recopiladas en el ámbito hospitalario permitiesen reconocer patrones asociados al reingreso. Como objetivo principal, se estableció desarrollar y validar un modelo predictivo de reingreso por exacerbación en un periodo de 30 días post-alta mediante técnicas de aprendizaje automático. Los objetivos específicos fueron: (i) recopilar una base de datos retrospectiva y prospectiva procedente del ámbito clínico, destinando la retrospectiva a la construcción y validación interna del modelo y la prospectiva a la validación temporal independiente del mismo; (ii) determinar las variables más relevantes para la predicción de reingresos por agudizaciones de EPOC; (iii) comparar el rendimiento predictivo de sendos enfoques de aprendizaje computacional: (a) Random Forest, propuesto como enfoque novedoso en el ámbito de la predicción de reingreso; y (b) red neuronal perceptrón multicapa, tomado como benchmark de referencia.
En este estudio observacional ambispectivo de diseño y validación de modelos predictivos, se reclutaron pacientes procedentes del Servicio de Neumología del Hospital Universitario Río Hortega de Valladolid. El estudio constó de dos fases: una etapa retrospectiva, cuyos datos fueron adquiridos entre octubre de 2017 y junio de 2019, y otra prospectiva, que abarcó un periodo temporal de enero a junio de 2025. Los pacientes incluidos presentaban diagnóstico previo confirmado de EPOC e ingreso hospitalario por exacerbación de la patología. La metodología aplicada en este trabajo se dividió en las siguientes etapas: análisis descriptivo y curación del dataset, selección de características predictoras, diseño y optimización de modelos predictivos y validación temporal en una población prospectiva. En primera instancia, se efectuó una imputación de datos aplicando K vecinos más cercanos. Tras esto, se seleccionó un subconjunto de las variables más relevantes y complementarias mediante el algoritmo ReliefF. A continuación, se realizó el diseño y optimización de un modelo predictivo bajo un enfoque de clasificación binaria: clase positiva (reingreso) o negativa (no reingreso). Para ello, se compararon sendos enfoques de aprendizaje computacional: ensemble learning, mediante Random Forest (RF) y redes neuronales, mediante un perceptrón multicapa (Multi-Layer Perceptron, MLP), cuyo rendimiento diagnóstico fue finalmente validado en una población prospectiva.
246 pacientes de la etapa retrospectiva cumplieron los criterios de inclusión, de los que finalmente se incluyeron 243 sujetos (42 reingresos y 201 no reingresos). En la base prospectiva, por su parte, 75 pacientes cumplieron los criterios de inclusión, incorporando finalmente 10 individuos (1 reingreso y 9 no reingresos). El algoritmo ReliefF seleccionó un total de 24 variables predictoras, destacando la pauta de mucolíticos al ingreso y alta, la presencia de microorganismos resistentes, el test TAI de uso correcto de inhaladores y la prescripción de oxigenoterapia domiciliaria basal. En la base de datos retrospectiva, Random Forest presentó una sensibilidad del 50.0%, especificidad del 91.7%, precisión o accuracy del 84.7%, F1 score del 52.2% y AUC de 0.826 en un subconjunto de pacientes de test. La red neuronal obtuvo una sensibilidad del 75.0%, especificidad del 85.0%, precisión o accuracy del 83.3%, F1 score del 60.0% y AUC de 0.857. En la cohorte prospectiva, Random Forest logró una sensibilidad del 100%, especificidad del 66.7%, precisión o accuracy del 70.0% y F1 score del 40.0%. La red neuronal alcanzó una sensibilidad del 100%, especificidad del 55.6%, precisión o accuracy del 60.0% y F1 score del 33.3%. MLP resultó ser superior en la base de datos retrospectiva a Random Forest en términos de F1 score y AUC, aunque su especificidad alcanzó un valor destacable. En la base de datos prospectiva, el modelo basado en Random Forest mostró mayor capacidad de generalización que la red neuronal MLP.
Los modelos predictivos desarrollados basados en Random Forest y MLP mostraron una capacidad predictiva notable para la estimación de reingresos por exacerbación de EPOC en los 30 días posteriores al alta. Ambos modelos alcanzaron valores de AUC superiores a 0.8, aunque la red MLP mostró un rendimiento mayor. El algoritmo ReliefF seleccionó un conjunto de variables que demostraron su utilidad en la identificación de patrones relacionados con el reingreso, destacando a su vez la heterogeneidad de la enfermedad. La validación temporal confirmó la viabilidad de los modelos en nuevas cohortes, aunque la fiabilidad de sus métricas aumentaría con bases de datos prospectivas más amplias. En comparación con otras investigaciones previas, los rendimientos predictivos alcanzaron resultados competitivos, incluso con un tamaño muestral limitado.
Materias (normalizadas)
Respiratorio, Aparato - Enfermedades
Tecnología médica
Materias Unesco
3205.08 Enfermedades Pulmonares
Palabras Clave
Enfermedad Pulmonar Obstructiva Crónica
Reingreso hospitalario
Exacerbación
Machine Learning
ReliefF
Random Forest
Red neuronal perceptrón multicapa
Idioma
spa
Derechos
openAccess
Aparece en las colecciones
- Trabajos Fin de Grado UVa [33161]
Ficheros en el ítem
La licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional









