<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-28T19:19:24Z</responseDate><request verb="GetRecord" identifier="oai:uvadoc.uva.es:10324/78565" metadataPrefix="etdms">https://uvadoc.uva.es/oai/request</request><GetRecord><record><header><identifier>oai:uvadoc.uva.es:10324/78565</identifier><datestamp>2025-10-10T19:04:23Z</datestamp><setSpec>com_10324_38</setSpec><setSpec>col_10324_852</setSpec></header><metadata><thesis xmlns="http://www.ndltd.org/standards/metadata/etdms/1.0/" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.ndltd.org/standards/metadata/etdms/1.0/ http://www.ndltd.org/standards/metadata/etdms/1.0/etdms.xsd">
<title>Optimización de IRS mediante Aprendizaje por Refuerzo para Redes 6G</title>
<creator>Cidoncha Molina, Pedro</creator>
<contributor>Martín De Andrés, Diego</contributor>
<contributor>Hernando Gallego, Francisco</contributor>
<contributor>Universidad de Valladolid. Escuela de Ingeniería Informática de Segovia</contributor>
<description>Este proyecto presenta el diseño y desarrollo de un sistema de optimización inteligente para&#xd;
redes 6G mediante técnicas de aprendizaje por refuerzo profundo, concretamente utilizando el algoritmo Deep Deterministic Policy Gradient (DDPG). El objetivo es maximizar la tasa de secreto&#xd;
en un sistema de comunicación asistido por una superficie reflectante inteligente (IRS), en un&#xd;
entorno donde el canal de transmisión no es completamente conocido, reflejando así condiciones&#xd;
más realistas.&#xd;
A lo largo del trabajo se ha desarrollado un entorno de simulación, una arquitectura modular&#xd;
del agente, diversas funciones de recompensa adaptadas a la seguridad física, y una interfaz&#xd;
por consola que permite entrenar, evaluar y comparar modelos de manera interactiva. Además,&#xd;
se han propuesto criterios claros de evaluación y se ha demostrado la estabilidad y eficacia del&#xd;
modelo frente a métodos tradicionales como AO (Alternating Optimization) y SDR (Semidefinite&#xd;
Relaxation), los cuales requieren conocimiento total del canal.&#xd;
Los resultados muestran que el enfoque basado en DDPG permite una mejora sustancial de la&#xd;
tasa de secreto, adaptándose dinámicamente a distintos escenarios sin necesidad de información&#xd;
completa del canal, lo que lo convierte en una solución prometedora para redes de próxima&#xd;
generación.</description>
<date>2025-10-10</date>
<date>2025-10-10</date>
<date>2025</date>
<type>info:eu-repo/semantics/bachelorThesis</type>
<identifier>https://uvadoc.uva.es/handle/10324/78565</identifier>
<language>spa</language>
<rights>info:eu-repo/semantics/openAccess</rights>
<rights>http://creativecommons.org/licenses/by-nc-nd/4.0/</rights>
<rights>Attribution-NonCommercial-NoDerivatives 4.0 Internacional</rights>
</thesis></metadata></record></GetRecord></OAI-PMH>