<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-14T16:03:23Z</responseDate><request verb="GetRecord" identifier="oai:uvadoc.uva.es:10324/71499" metadataPrefix="edm">https://uvadoc.uva.es/oai/request</request><GetRecord><record><header><identifier>oai:uvadoc.uva.es:10324/71499</identifier><datestamp>2024-11-15T20:02:13Z</datestamp><setSpec>com_10324_38</setSpec><setSpec>col_10324_787</setSpec></header><metadata><rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:ore="http://www.openarchives.org/ore/terms/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:ds="http://dspace.org/ds/elements/1.1/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:edm="http://www.europeana.eu/schemas/edm/" xsi:schemaLocation="http://www.w3.org/1999/02/22-rdf-syntax-ns# http://www.europeana.eu/schemas/edm/EDM.xsd">
<edm:ProvidedCHO rdf:about="https://uvadoc.uva.es/handle/10324/71499">
<dc:contributor>Bregón Bregón, Aníbal</dc:contributor>
<dc:contributor>Pulido Junquera, José Belarmino</dc:contributor>
<dc:contributor>Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid</dc:contributor>
<dc:creator>Rebé Martín, Jorge</dc:creator>
<dc:date>2024</dc:date>
<dc:description>La estrategia de carrera en Fórmula 1 es uno de los elementos críticos que pueden&#xd;
cambiar el resultado de un piloto en una carrera. En este trabajo se ha construido&#xd;
un sistema basado en aprendizaje por refuerzo en el que un agente aprende a tomar&#xd;
las decisiones estratégicas óptimas en cada vuelta (parar o no parar, y si se para,&#xd;
qué neumático poner).&#xd;
Se ha desarrollado un simulador de carreras de Fórmula 1 que se ha utilizado como&#xd;
entorno para que el agente interactúe con él y pueda aprender cuáles son las acciones&#xd;
a tomar en cada momento que maximicen la posición final en carrera. Se utilizan&#xd;
varios algoritmos (DQN, QR-DQN y A2C) y varias funciones de recompensa con los&#xd;
que se entrenará a varios agentes. Finalmente, se evalúan los agentes entrenados y&#xd;
se selecciona el mejor.</dc:description>
<dc:description>Race strategy in Formula One is one of the most critic elements that can change&#xd;
the final position of a driver in a race. In this work a full reinforcement learning&#xd;
system is built, in which the agent learns to take the optimal strategy decisions&#xd;
every lap (to pit or not to pit, and if pit what tyre to fit).&#xd;
A Formula 1 races simulator has been developed, and it is used as the environment&#xd;
that the agent interacts with in order to learn what actions to take given the race&#xd;
state in order to maximize the final position in the race. Various algorithms (DQN,&#xd;
QR-DQN and A2C) and reward functions are used, with which agents will be trained.&#xd;
Finally, trained agents are evaluated and the best one is selected.</dc:description>
<dc:format>application/pdf</dc:format>
<dc:identifier>https://uvadoc.uva.es/handle/10324/71499</dc:identifier>
<dc:language>spa</dc:language>
<dc:title>Toma de decisiones de estrategia durante las carreras de Fórmula 1 utilizando Deep Reinforcement Learning</dc:title>
<dc:type>info:eu-repo/semantics/masterThesis</dc:type>
<edm:type>TEXT</edm:type>
</edm:ProvidedCHO>
<ore:Aggregation rdf:about="https://uvadoc.uva.es/handle/10324/71499#aggregation">
<edm:aggregatedCHO rdf:resource="https://uvadoc.uva.es/handle/10324/71499"/>
<edm:dataProvider>UVaDOC. Repositorio Documental de la Universidad de Valladolid</edm:dataProvider>
<edm:isShownAt rdf:resource="https://uvadoc.uva.es/handle/10324/71499"/>
<edm:isShownBy rdf:resource="https://uvadoc.uva.es/bitstream/10324/71499/1/TFM-G2000.pdf"/>
<edm:provider>Hispana</edm:provider>
<edm:rights rdf:resource="http://creativecommons.org/licenses/by-nc-nd/4.0/"/>
</ore:Aggregation>
<edm:WebResource rdf:about="https://uvadoc.uva.es/bitstream/10324/71499/1/TFM-G2000.pdf">
<edm:rights rdf:resource="http://creativecommons.org/licenses/by-nc-nd/4.0/"/>
</edm:WebResource>
</rdf:RDF></metadata></record></GetRecord></OAI-PMH>