Desarrollo de un Data Lake para la gestión de datos de estadísticos de la competición NBA (National Basketball Association)

Sáenz Niño, Héctor

Título

dc.contributor.advisor	Pulido Junquera, José Belarmino	es
dc.contributor.advisor	Álvarez Esteban, Pedro César	es
dc.contributor.author	Sáenz Niño, Héctor
dc.contributor.editor	Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid	es
dc.date.accessioned	2020-12-16T16:20:49Z
dc.date.available	2020-12-16T16:20:49Z
dc.date.issued	2020
dc.identifier.uri	http://uvadoc.uva.es/handle/10324/44398
dc.description.abstract	El término "Big Data" se utiliza para describir los grandes volúmenes de datos que se generan actualmente. Sin embargo, la dificultad para tratar de estos conjuntos de datos mediante tecnologías tradicionales, ha fomentado el desarrollo de nuevas herramientas y arquitecturas de sistemas altamente escalables. Este trabajo se centra en el desarrollo de un repositorio capaz de recolectar, almacenar y enriquecer datos de baloncesto. Para la recolección de los datos, se ha desarrollado un sistema capaz de obtener las estadísticas de páginas web de manera automática. Uno de los objetivos del trabajo era analizar la opción de usar un Data Lake para almacenar los datos, tanto adquiridos como generados. Por ese motivo los datos se transfieren a un Data Lake, donde son almacenados y transformados. Por último, se ha desarrollado una interfaz para la visualización de los datos enriquecidos.	es
dc.description.abstract	The term "Big Data" is used to describe the large volume of data currently generated. However, the difficulty of handling these datasets by traditional means, has motivated the develompent of new highly scalable tools and system architectures. This project focuses on the development of a central repository capable of collecting, storing and enriching basketball related data. In order to collect the data, a system capable of automatically scrape websites has been developed. One of the objectives of this proyect was to consider the usage of a Data Lake to store the data, both scraped and generated. For this reason, the data is then delivered to a Data Lake, responsible for the storage and enrichment of the dataset. In addition, an interface to visualize the enriched data has been implemented.	es
dc.format.mimetype	application/pdf	es
dc.language.iso	spa	es
dc.rights.accessRights	info:eu-repo/semantics/openAccess	es
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject.classification	Data lake	es
dc.subject.classification	Hadoop	es
dc.subject.classification	Big Data	es
dc.title	Desarrollo de un Data Lake para la gestión de datos de estadísticos de la competición NBA (National Basketball Association)	es
dc.type	info:eu-repo/semantics/bachelorThesis	es
dc.description.degree	Grado en Ingeniería Informática	es
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 Internacional	*

Files in this item

Name:: TFG-G4675.pdf
Size:: 4.221Mb
Format:: PDF

FilesOpen

This item appears in the following Collection(s)

Trabajos Fin de Grado UVa [33761]

Show simple item record

Except where otherwise noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internacional