2026-04-28T19:26:53Zhttps://uvadoc.uva.es/oai/request

oai:uvadoc.uva.es:10324/714992024-11-15T20:02:13Zcom_10324_38col_10324_787

Toma de decisiones de estrategia durante las carreras de Fórmula 1 utilizando Deep Reinforcement Learning Rebé Martín, Jorge Bregón Bregón, Aníbal Pulido Junquera, José Belarmino La estrategia de carrera en Fórmula 1 es uno de los elementos críticos que pueden cambiar el resultado de un piloto en una carrera. En este trabajo se ha construido un sistema basado en aprendizaje por refuerzo en el que un agente aprende a tomar las decisiones estratégicas óptimas en cada vuelta (parar o no parar, y si se para, qué neumático poner). Se ha desarrollado un simulador de carreras de Fórmula 1 que se ha utilizado como entorno para que el agente interactúe con él y pueda aprender cuáles son las acciones a tomar en cada momento que maximicen la posición final en carrera. Se utilizan varios algoritmos (DQN, QR-DQN y A2C) y varias funciones de recompensa con los que se entrenará a varios agentes. Finalmente, se evalúan los agentes entrenados y se selecciona el mejor. Race strategy in Formula One is one of the most critic elements that can change the final position of a driver in a race. In this work a full reinforcement learning system is built, in which the agent learns to take the optimal strategy decisions every lap (to pit or not to pit, and if pit what tyre to fit). A Formula 1 races simulator has been developed, and it is used as the environment that the agent interacts with in order to learn what actions to take given the race state in order to maximize the final position in the race. Various algorithms (DQN, QR-DQN and A2C) and reward functions are used, with which agents will be trained. Finally, trained agents are evaluated and the best one is selected. 2024 info:eu-repo/semantics/masterThesis spa Departamento de Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia Artificial, Lenguajes y Sistemas Informáticos) https://uvadoc.uva.es/handle/10324/71499 https://uvadoc.uva.es/bitstream/10324/71499/3/license.txt 289d98c1665ee0d20312360f0e8643c8 https://uvadoc.uva.es/bitstream/10324/71499/1/TFM-G2000.pdf 3f2b96507a8c6a80b00f9143f58f04ce Attribution-NonCommercial-NoDerivatives 4.0 Internacional