RT info:eu-repo/semantics/bachelorThesis T1 Enrutamiento y establecimiento dinámico de conexiones en redes de transporte mediante aprendizaje por refuerzo A1 Ferens Michalek, Mieszko Jan A2 Universidad de Valladolid. Escuela Técnica Superior de Ingenieros de Telecomunicación K1 Aprendizaje por refuerzo K1 Deep Q-learning K1 ChainerRL K1 OpenAI Gym K1 Enrutamiento AB El aprendizaje automático está siendo utilizado en cada vez más ámbitos como una solución a problemas existentes más eficiente que las técnicas tradicionales. Un problema típico en la actualidad es el enrutamiento en redes telemáticas. Relacionado con esta cuestión, es muy importante realizar una asignación eficiente de recursos a la hora de establecer conexiones en estas redes, por lo que recientemente muchos estudios se han centrado en buscar algoritmos de aprendizaje automático que resuelvan esto. En este Trabajo Fin de Grado (TFG) nos centramos en el aprendizaje por refuerzo, una rama del aprendizaje automático en auge. Explicamos sus fundamentos, así como algunos algoritmos para después aplicarlos a dos problemas concretos. El primero es la búsqueda de la ruta de menor coste en una red de comunicaciones, un caso de estudio típico, que empleamos como iniciación al ámbito del aprendizaje por refuerzo. Después nos centramos en el establecimiento dinámico de conexiones en una red de transporte, mostrando el rendimiento en distintos casos para estos algoritmos. YR 2020 FD 2020 LK http://uvadoc.uva.es/handle/10324/42740 UL http://uvadoc.uva.es/handle/10324/42740 LA spa DS UVaDOC RD 21-sep-2024