Enrutamiento y establecimiento dinámico de conexiones en redes de transporte mediante aprendizaje por refuerzo

Ferens Michalek, Mieszko Jan

Por favor, use este identificador para citar o enlazar este ítem:http://uvadoc.uva.es/handle/10324/42740

Título

Enrutamiento y establecimiento dinámico de conexiones en redes de transporte mediante aprendizaje por refuerzo

Autor

Ferens Michalek, Mieszko Jan

Director o Tutor

Miguel Jiménez, Ignacio de

Durán Barroso, Ramón José

Editor

Universidad de Valladolid. Escuela Técnica Superior de Ingenieros de Telecomunicación

Año del Documento

2020

Titulación

Grado en Ingeniería de Tecnologías de Telecomunicación

Zusammenfassung

El aprendizaje automático está siendo utilizado en cada vez más ámbitos como una solución a problemas existentes más eficiente que las técnicas tradicionales. Un problema típico en la actualidad es el enrutamiento en redes telemáticas. Relacionado con esta cuestión, es muy importante realizar una asignación eficiente de recursos a la hora de establecer conexiones en estas redes, por lo que recientemente muchos estudios se han centrado en buscar algoritmos de aprendizaje automático que resuelvan esto. En este Trabajo Fin de Grado (TFG) nos centramos en el aprendizaje por refuerzo, una rama del aprendizaje automático en auge. Explicamos sus fundamentos, así como algunos algoritmos para después aplicarlos a dos problemas concretos. El primero es la búsqueda de la ruta de menor coste en una red de comunicaciones, un caso de estudio típico, que empleamos como iniciación al ámbito del aprendizaje por refuerzo. Después nos centramos en el establecimiento dinámico de conexiones en una red de transporte, mostrando el rendimiento en distintos casos para estos algoritmos.

Machine learning is being used in an increasing range of applications, as a more efficient solution to existing problems than traditional methods. A common problem in recent times is routing in telematic networks. Related to this issue, efficient resource assignment when establishing connections in these networks is a key issue. Therefore, many recent studies have focused on devising machine learning algorithms to solve these problems. In this Bachelor Thesis we will focus on reinforcement learning, a booming machine learning branch. We explain its fundamentals, as well as several algorithms which we then apply to two specific problems. The first one is the search for the lowest cost route in a communications network, a typical case study, which we use as an initiation into reinforcement learning. Afterwards, we turn our attention to dynamic connection establishment in a transport network, showing the performance of these algorithms in various cases.

Palabras Clave

Aprendizaje por refuerzo

Deep Q-learning

ChainerRL

OpenAI Gym

Enrutamiento