RT info:eu-repo/semantics/bachelorThesis T1 Evaluación de múltiples arquitecturas de detección de la pose humana mediante aprendizaje profundo en aplicaciones de análisis cinemático respecto al uso de sensores inerciales A1 Medrano Paredes, Mario A2 Universidad de Valladolid. Escuela Técnica Superior de Ingenieros de Telecomunicación K1 Aprendizaje profundo K1 Análisis cinemático K1 Segmentación de la marcha AB El análisis cuantitativo del movimiento humano es una herramienta fundamental en eldiagnóstico y la rehabilitación clínica, si bien los sistemas tradicionales de captura de movimientopresentan limitaciones en cuanto a su coste, complejidad de uso y accesibilidad. Este Trabajo deFin de Grado aborda estas limitaciones desde una doble perspectiva, explorando el potencial delaprendizaje profundo no sólo para la captura cinemática, sino también para aplicaciones médicas,y, en específico, para la segmentación de la marcha mediante alternativas robustas y de bajo costefuera de laboratorios especializados.La primera parte del trabajo se centra en la evaluación de cuatro arquitecturas para laEstimación de la Pose Humana (HPE) en 3D a partir de vídeo monocular (MotionAGFormer,MotionBERT, VideoPose3D y NVIDIA BodyTrack). Utilizando el dataset VIDIMU, se calcularonlos ángulos articulares de múltiples sujetos en diversas actividades cotidianas y se comparó elrendimiento de cada modelo basado en vídeo frente a los datos de referencia obtenidos de sensoresinerciales (IMUs) mediante métricas de error y correlación estadística. Los resultados revelaronque, a pesar de que ningún modelo es universalmente superior, MotionAGFormer ofreció el menorRMSE (9.27° ± 4.80°) y la mayor correlación (0.67 ± 0.28) para el conjunto de datos evaluado.Esto verificó la viabilidad de los sistemas visión como alternativa al hardware dedicado para elanálisis cinemático en entornos no controlados, destacando los compromisos entre precisión,tiempo de inferencia y eficiencia computacional.La segunda parte se enfoca en el desarrollo de un modelo de deep learning para lasegmentación de las fases de la marcha. Para ello, se estimaron las señales de velocidad angular apartir de los cuaterniones de los IMUs y se detectaron los eventos clave (heel strike, toe off).Posteriormente, se desarrolló una interfaz gráfica de usuario (GUI) para supervisar el etiquetadode los datos. Finalmente, se entrenó y optimizó una red BiLSTM para clasificar las fases de lamarcha a partir de secuencias de ángulos articulares de la rodilla obtenidos mediante IMUs ymodelos HPE. El modelo entrenado demostró una capacidad de segmentación prometedora, conF1-Score y accuracy superior a 80% para los datos de los sensores inerciales y superior al 70%para los de vídeo, validando la hipótesis de que es posible aprender patrones temporales complejosa partir de ciclos de marcha. YR 2025 FD 2025 LK https://uvadoc.uva.es/handle/10324/79700 UL https://uvadoc.uva.es/handle/10324/79700 LA spa NO Departamento de Teoría de la Señal y Comunicaciones e Ingeniería Telemática DS UVaDOC RD 14-nov-2025