Mostrar el registro sencillo del ítem

dc.contributor.advisorPulido Junquera, José Belarmino es
dc.contributor.advisorÁlvarez Esteban, Pedro César es
dc.contributor.authorSáenz Niño, Héctor
dc.contributor.editorUniversidad de Valladolid. Escuela de Ingeniería Informática de Valladolid es
dc.date.accessioned2020-12-16T16:20:49Z
dc.date.available2020-12-16T16:20:49Z
dc.date.issued2020
dc.identifier.urihttp://uvadoc.uva.es/handle/10324/44398
dc.description.abstractEl término "Big Data" se utiliza para describir los grandes volúmenes de datos que se generan actualmente. Sin embargo, la dificultad para tratar de estos conjuntos de datos mediante tecnologías tradicionales, ha fomentado el desarrollo de nuevas herramientas y arquitecturas de sistemas altamente escalables. Este trabajo se centra en el desarrollo de un repositorio capaz de recolectar, almacenar y enriquecer datos de baloncesto. Para la recolección de los datos, se ha desarrollado un sistema capaz de obtener las estadísticas de páginas web de manera automática. Uno de los objetivos del trabajo era analizar la opción de usar un Data Lake para almacenar los datos, tanto adquiridos como generados. Por ese motivo los datos se transfieren a un Data Lake, donde son almacenados y transformados. Por último, se ha desarrollado una interfaz para la visualización de los datos enriquecidos.es
dc.description.abstractThe term "Big Data" is used to describe the large volume of data currently generated. However, the difficulty of handling these datasets by traditional means, has motivated the develompent of new highly scalable tools and system architectures. This project focuses on the development of a central repository capable of collecting, storing and enriching basketball related data. In order to collect the data, a system capable of automatically scrape websites has been developed. One of the objectives of this proyect was to consider the usage of a Data Lake to store the data, both scraped and generated. For this reason, the data is then delivered to a Data Lake, responsible for the storage and enrichment of the dataset. In addition, an interface to visualize the enriched data has been implemented.es
dc.format.mimetypeapplication/pdfes
dc.language.isospaes
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subject.classificationData lakees
dc.subject.classificationHadoopes
dc.subject.classificationBig Dataes
dc.titleDesarrollo de un Data Lake para la gestión de datos de estadísticos de la competición NBA (National Basketball Association)es
dc.typeinfo:eu-repo/semantics/bachelorThesises
dc.description.degreeGrado en Ingeniería Informáticaes
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*


Ficheros en el ítem

Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem