Optimización de IRS mediante Aprendizaje por Refuerzo para Redes 6G

2026-04-28T19:19:24Zhttps://uvadoc.uva.es/oai/request

oai:uvadoc.uva.es:10324/785652025-10-10T19:04:23Zcom_10324_38col_10324_852

Optimización de IRS mediante Aprendizaje por Refuerzo para Redes 6G Cidoncha Molina, Pedro Martín De Andrés, Diego Hernando Gallego, Francisco Universidad de Valladolid. Escuela de Ingeniería Informática de Segovia Este proyecto presenta el diseño y desarrollo de un sistema de optimización inteligente para redes 6G mediante técnicas de aprendizaje por refuerzo profundo, concretamente utilizando el algoritmo Deep Deterministic Policy Gradient (DDPG). El objetivo es maximizar la tasa de secreto en un sistema de comunicación asistido por una superficie reflectante inteligente (IRS), en un entorno donde el canal de transmisión no es completamente conocido, reflejando así condiciones más realistas. A lo largo del trabajo se ha desarrollado un entorno de simulación, una arquitectura modular del agente, diversas funciones de recompensa adaptadas a la seguridad física, y una interfaz por consola que permite entrenar, evaluar y comparar modelos de manera interactiva. Además, se han propuesto criterios claros de evaluación y se ha demostrado la estabilidad y eficacia del modelo frente a métodos tradicionales como AO (Alternating Optimization) y SDR (Semidefinite Relaxation), los cuales requieren conocimiento total del canal. Los resultados muestran que el enfoque basado en DDPG permite una mejora sustancial de la tasa de secreto, adaptándose dinámicamente a distintos escenarios sin necesidad de información completa del canal, lo que lo convierte en una solución prometedora para redes de próxima generación. 2025-10-10 2025-10-10 2025 info:eu-repo/semantics/bachelorThesis https://uvadoc.uva.es/handle/10324/78565 spa info:eu-repo/semantics/openAccess http://creativecommons.org/licenses/by-nc-nd/4.0/ Attribution-NonCommercial-NoDerivatives 4.0 Internacional