RT info:eu-repo/semantics/masterThesis T1 Técnicas avanzadas de aprendizaje profundo para la detección y análisis de tos en pacientes respiratorios A1 Pérez Alonso, Diego Asay A2 Universidad de Valladolid. Escuela Técnica Superior de Ingenieros de Telecomunicación K1 Deep Learning K1 Tos K1 Detector AB Antecedentes: La tos es un mecanismo de defensa y expulsión del aparato respiratorio que provoca una respuestarefleja y sonora. En la actualidad, el análisis de la tos como marcador sintomático del avance de una enfermedadse apoya en instrumentos poco adecuados para el seguimiento en escenarios de la vida real. Algunos solo se hanevaluado en ambientes silenciosos y controlados, otros se diseñaron para resolver un problema más general que ladetección de la tos o se enfocan en una población muy concreta. Asimismo, algunos enfoques no se han concebidocon la eficiencia requerida para operar en un smartphone. Por estos motivos, los métodos de análisis de audioempleados en estos dispositivos no son capaces de manejar ambientes ruidosos, como el caso de un paciente queuse su smartphone en el bolsillo como dispositivo de captura de datos.Objetivo: Este Trabajo de Fin de Máster (TFM) tiene como propósito emplear técnicas de aprendizaje profundo(Deep Learning) para diseñar un sistema de “audición máquina” (Machine Hearing) que procese espectrogramasde señales acústicas y los clasifique de acuerdo a su contenido. Específicamente, se pretende reconocer los espectrogramasque contienen tos y los que no, y además clasificar cada tos a partir de sus propiedades espectrales segúnla enfermedad respiratorias asociada a la tos o el tipo de tos.Métodos: Para llevar a cabo el proyecto, adquirimos 36866 señales de audio contaminadas por ruido de 20pacientes respiratorios con distintas afecciones. La mitad de estas señales correspondieron a episodios de tos,mientras que la otra mitad no contenía ningún sonido de tos. Estas señales de audio se someten a un preprocesamientoen tres etapas. Primero, las señales de audio originales (señales de tos y no tos) se segmentan para quecada segmento dure un segundo. En segundo lugar, se transforman las señales 1D temporales en imágenes (señales2D) mediante tres métodos. Los dos primeros métodos transforman cada clip de audio, que son señales de tiempo(1D), en señales de tiempo-frecuencia (imágenes 2D) realizando un espectrograma logarítmico o un espectrogramade mel. El tercer método aplica a los audios la técnica de ventanas deslizadas cambiando la forma del vector ytransformándolo en una matriz. Posteriormente, los datos se normalizan para poder alimentar a una red neuronalrecurrente convolucional (C-LSTM). La red neuronal convolucional (Convolutional Neural Network, CNN) extraecaracterísticas de los espectrogramas de audio automáticamente para identificar “patrones” espectrales o temporales.Luego, se alimenta a una red neuronal recurrente de memoria a corto plazo (Long Short-Term Memory, LSTM),que predice el frame actual haciendo referencia a los frames adyacentes. De esta manera, primero detecta si el clipde audio contiene tos o no, y en caso afirmativo, procedemos a realizar un análisis posterior con el objetivo dedetectar el tipo de tos o la enfermedad subyacente.Resultados: El sistema de audiodetección de tos que obtuvo una especificidad mas alta presenta sensibilidaddel 86,23% y una especificidad del 93,90 %. Por otro lado, el método de clasificación de tos que obtuvo la mayorexactitud fue el que discriminó entre tos de pacientes con COVID-19 y tos de pacientes que tiene síntomas perosin diagnóstico de COVID-19, que obtuvo un 58,21 %.Conclusiones: Los resultados de este TFM abren la posibilidad de crear un dispositivo cómodo y no invasivo,con una mínima interferencia en las actividades cotidianas, capaz de detectar con carácter temprano enfermedadesrespiratorias, beneficiando a pacientes, profesionales sanitarios y sistemas nacionales de salud. YR 2023 FD 2023 LK https://uvadoc.uva.es/handle/10324/63132 UL https://uvadoc.uva.es/handle/10324/63132 LA spa NO Departamento de Teoría de la Señal y Comunicaciones e Ingeniería Telemática DS UVaDOC RD 03-mar-2025