Por favor, use este identificador para citar o enlazar este ítem:http://uvadoc.uva.es/handle/10324/42740
Título
Enrutamiento y establecimiento dinámico de conexiones en redes de transporte mediante aprendizaje por refuerzo
Director o Tutor
Año del Documento
2020
Titulación
Grado en Ingeniería de Tecnologías de Telecomunicación
Resumen
El aprendizaje automático está siendo utilizado en cada vez más ámbitos como una solución a problemas existentes más eficiente que las técnicas tradicionales. Un problema típico en la actualidad es el enrutamiento en redes telemáticas. Relacionado con esta cuestión, es muy importante realizar una asignación eficiente de recursos a la hora de establecer conexiones en estas redes, por lo que recientemente muchos estudios se han centrado en buscar algoritmos de aprendizaje automático que resuelvan esto. En este Trabajo Fin de Grado (TFG) nos centramos en el aprendizaje por refuerzo, una rama del aprendizaje automático en auge. Explicamos sus fundamentos, así como algunos algoritmos para después aplicarlos a dos problemas concretos. El primero es la búsqueda de la ruta de menor coste en una red de comunicaciones, un caso de estudio típico, que empleamos como iniciación al ámbito del aprendizaje por refuerzo. Después nos centramos en el establecimiento dinámico de conexiones en una red de transporte, mostrando el rendimiento en distintos casos para estos algoritmos. Machine learning is being used in an increasing range of applications, as a more efficient solution to existing problems than traditional methods. A common problem in recent times is routing in telematic networks. Related to this issue, efficient resource assignment when establishing connections in these networks is a key issue. Therefore, many recent studies have focused on devising machine learning algorithms to solve these problems. In this Bachelor Thesis we will focus on reinforcement learning, a booming machine learning branch. We explain its fundamentals, as well as several algorithms which we then apply to two specific problems. The first one is the search for the lowest cost route in a communications network, a typical case study, which we use as an initiation into reinforcement learning. Afterwards, we turn our attention to dynamic connection establishment in a transport network, showing the performance of these algorithms in various cases.
Palabras Clave
Aprendizaje por refuerzo
Deep Q-learning
ChainerRL
OpenAI Gym
Enrutamiento
Idioma
spa
Derechos
openAccess
Aparece en las colecciones
- Trabajos Fin de Grado UVa [30178]
Ficheros en el ítem
La licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional