<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-05-05T13:07:22Z</responseDate><request verb="GetRecord" identifier="oai:uvadoc.uva.es:10324/44453" metadataPrefix="dim">https://uvadoc.uva.es/oai/request</request><GetRecord><record><header><identifier>oai:uvadoc.uva.es:10324/44453</identifier><datestamp>2021-06-18T09:09:16Z</datestamp><setSpec>com_10324_38</setSpec><setSpec>col_10324_787</setSpec></header><metadata><dim:dim xmlns:dim="http://www.dspace.org/xmlns/dspace/dim" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.dspace.org/xmlns/dspace/dim http://www.dspace.org/schema/dim.xsd">
<dim:field mdschema="dc" element="contributor" qualifier="advisor" lang="es" authority="97dad72678069273" confidence="500" orcid_id="0000-0003-4418-561X">Martínez Prieto, Miguel Angel</dim:field>
<dim:field mdschema="dc" element="contributor" qualifier="advisor" lang="es" authority="048b863f12428df2" confidence="500" orcid_id="">Bregón Bregón, Aníbal</dim:field>
<dim:field mdschema="dc" element="contributor" qualifier="author" authority="172c1a6e-dda9-44e3-9b2d-b5561fe29422" confidence="500" orcid_id="">Cuervo Fernández, Esther</dim:field>
<dim:field mdschema="dc" element="contributor" qualifier="editor" lang="es" authority="EDUVA32" confidence="500" orcid_id="">Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid</dim:field>
<dim:field mdschema="dc" element="date" qualifier="accessioned">2020-12-18T12:30:24Z</dim:field>
<dim:field mdschema="dc" element="date" qualifier="available">2020-12-18T12:30:24Z</dim:field>
<dim:field mdschema="dc" element="date" qualifier="issued">2020</dim:field>
<dim:field mdschema="dc" element="identifier" qualifier="uri">http://uvadoc.uva.es/handle/10324/44453</dim:field>
<dim:field mdschema="dc" element="description" qualifier="abstract" lang="es">La presencia de contaminantes en el aire se sitúa como una de las mayores causas de muerte prematura en el&#xd;
mundo, con el 91% de la población humana viviendo en ambientes con niveles de polución peligrosos. Además, la&#xd;
reducción de los niveles de contaminante es uno de los Objetivos de Desarrollo Sostenible de las Naciones Unidas,&#xd;
por lo que es importante para gobiernos y entidades locales contar con un sistema complejo de control de la calidad&#xd;
del aire. Uno de los primeros pasos para ello es tener una amplia red de medición, como es el caso en la provincia&#xd;
de Valladolid, que además ofrece sus datos de manera abierta. Sin embargo, no dispone de sistemas de exploración&#xd;
de datos y predicción, con los que se mejoraría la transparencia y fomentaría la creación de estudios sobre el tema.&#xd;
En este Trabajo Fin de Máster se plantea la creación de un sistema Big Data que permita el control, análisis&#xd;
y predicción de datos horarios de once estaciones de medición de la calidad del aire en la provincia de Valladolid,&#xd;
utilizando datos totalmente públicos, con una metodología iterativa apoyada en un proceso ETL completamente&#xd;
automatizado.&#xd;
El resultado es un Data Lake con actualización diaria implementado sobre un clúster Hadoop real, una herramienta&#xd;
de visualización elaborada en PowerBI, que proporciona un dashboard con la información necesaria para&#xd;
realizar un seguimiento diario de la calidad del aire, y un análisis exploratorio y predictivo, utilizando algoritmos&#xd;
de Aprendizaje Automático, con resultados satisfactorios respecto a la capacidad de producir predicciones certeras&#xd;
en múltiples puntos de la provincia a partir de los datos recogidos.</dim:field>
<dim:field mdschema="dc" element="description" qualifier="abstract" lang="es">The presence of pollutants in the air is currently one of the top causes for premature deaths in the world, with&#xd;
91% of the world's population living with dangerous levels of air pollution. Besides this, the reduction of pollution&#xd;
levels is one of the Sustainable Development Goals of the United Nations, which makes it key for governments and&#xd;
local authorities to have a complex system for air quality control. One of the  rst steps towards this goal is having&#xd;
a vast measurement network, as is the case in Valladolid, whose data is also o ered openly. However, there's a lack&#xd;
of data exploration systems and predictions in the resources that Valladolid o ers, with which transparency could&#xd;
be improved, besides also sponsoring the creation of new projects around the theme.&#xd;
In this End of Master's Project we set up the creation of a Big Data system that would allow for the control,&#xd;
analysis and prediction of hourly pollution data from eleven measurement stations around the province of Valladolid,&#xd;
using data that is completely public, with an iterative methodology based on am entirely automated ETL process.&#xd;
The result is a Data Lake updated daily deployed over a real Hadoop cluster, a visualization tool implemented&#xd;
in PowerBI, providing a dashboard with the information needed to follow up on daily air quality, and lastly an&#xd;
exploratory and predictive analysis using Machine Learning algorithms, with satisfactory results with regards to&#xd;
the capacity of producing accurate predictions in multiple points of the province from the data used.</dim:field>
<dim:field mdschema="dc" element="description" qualifier="sponsorship" lang="es">Departamento de Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia Artificial, Lenguajes y Sistemas Informáticos)</dim:field>
<dim:field mdschema="dc" element="description" qualifier="degree" lang="es">Máster en Ingeniería Informática</dim:field>
<dim:field mdschema="dc" element="format" qualifier="mimetype" lang="es">application/pdf</dim:field>
<dim:field mdschema="dc" element="language" qualifier="iso" lang="es">spa</dim:field>
<dim:field mdschema="dc" element="rights" qualifier="accessRights" lang="es">info:eu-repo/semantics/openAccess</dim:field>
<dim:field mdschema="dc" element="rights" qualifier="uri" lang="*">http://creativecommons.org/licenses/by-nc-nd/4.0/</dim:field>
<dim:field mdschema="dc" element="rights" lang="*">Attribution-NonCommercial-NoDerivatives 4.0 Internacional</dim:field>
<dim:field mdschema="dc" element="subject" qualifier="classification" lang="es">Big Data</dim:field>
<dim:field mdschema="dc" element="subject" qualifier="classification" lang="es">Calidad del aire</dim:field>
<dim:field mdschema="dc" element="title" lang="es">Control, análisis y predicción de la calidad del aire en Valladolid mediante tecnología Big Data</dim:field>
<dim:field mdschema="dc" element="type" lang="es">info:eu-repo/semantics/masterThesis</dim:field>
</dim:dim></metadata></record></GetRecord></OAI-PMH>