<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-05-05T22:00:04Z</responseDate><request verb="GetRecord" identifier="oai:uvadoc.uva.es:10324/44398" metadataPrefix="etdms">https://uvadoc.uva.es/oai/request</request><GetRecord><record><header><identifier>oai:uvadoc.uva.es:10324/44398</identifier><datestamp>2021-12-03T07:43:32Z</datestamp><setSpec>com_10324_38</setSpec><setSpec>col_10324_852</setSpec></header><metadata><thesis xmlns="http://www.ndltd.org/standards/metadata/etdms/1.0/" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.ndltd.org/standards/metadata/etdms/1.0/ http://www.ndltd.org/standards/metadata/etdms/1.0/etdms.xsd">
<title>Desarrollo de un Data Lake para la gestión de datos de estadísticos de la competición NBA (National Basketball Association)</title>
<creator>Sáenz Niño, Héctor</creator>
<contributor>Pulido Junquera, José Belarmino</contributor>
<contributor>Álvarez Esteban, Pedro César</contributor>
<contributor>Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid</contributor>
<description>El término "Big Data" se utiliza para describir los grandes volúmenes de datos que se&#xd;
generan actualmente. Sin embargo, la dificultad para tratar de estos conjuntos de datos&#xd;
mediante tecnologías tradicionales, ha fomentado el desarrollo de nuevas herramientas y&#xd;
arquitecturas de sistemas altamente escalables.&#xd;
Este trabajo se centra en el desarrollo de un repositorio capaz de recolectar, almacenar y&#xd;
enriquecer datos de baloncesto. Para la recolección de los datos, se ha desarrollado un&#xd;
sistema capaz de obtener las estadísticas de páginas web de manera automática. Uno de los&#xd;
objetivos del trabajo era analizar la opción de usar un Data Lake para almacenar los datos,&#xd;
tanto adquiridos como generados. Por ese motivo los datos se transfieren a un Data Lake,&#xd;
donde son almacenados y transformados. Por último, se ha desarrollado una interfaz para&#xd;
la visualización de los datos enriquecidos.</description>
<description>The term "Big Data" is used to describe the large volume of data currently generated.&#xd;
However, the difficulty of handling these datasets by traditional means, has motivated the&#xd;
develompent of new highly scalable tools and system architectures.&#xd;
This project focuses on the development of a central repository capable of collecting,&#xd;
storing and enriching basketball related data. In order to collect the data, a system capable&#xd;
of automatically scrape websites has been developed. One of the objectives of this proyect&#xd;
was to consider the usage of a Data Lake to store the data, both scraped and generated.&#xd;
For this reason, the data is then delivered to a Data Lake, responsible for the storage and&#xd;
enrichment of the dataset. In addition, an interface to visualize the enriched data has been&#xd;
implemented.</description>
<date>2020-12-16</date>
<date>2020-12-16</date>
<date>2020</date>
<type>info:eu-repo/semantics/bachelorThesis</type>
<identifier>http://uvadoc.uva.es/handle/10324/44398</identifier>
<language>spa</language>
<rights>info:eu-repo/semantics/openAccess</rights>
<rights>http://creativecommons.org/licenses/by-nc-nd/4.0/</rights>
<rights>Attribution-NonCommercial-NoDerivatives 4.0 Internacional</rights>
</thesis></metadata></record></GetRecord></OAI-PMH>