RT info:eu-repo/semantics/bachelorThesis T1 Biblioteca Python para el apoyo al desarrollo de pipelines de procesamiento de datos con Spark A1 Sanz San José, Óliver Luis A2 Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid K1 Biblioteca Python K1 Pipeline K1 Spark K1 PySpark AB Esta es la memoria del trabajo de fin de grado presentado por Óliver L. Sanz en el Grado enIngeniería Informática de la Universidad de Valladolid en Julio de 2018. En ella, se describe elcontexto, motivación, así como el proceso de diseño, desarrollo y validación de una biblioteca escritaen el lenguaje de programación Python para el desarrollo de pipelines (secuencias) de tratamiento dedatos con el motor de procesamiento Spark, desarrollada para la empresa Luce InnovativeTechnologies. Los objetivos de diseño de esta biblioteca son que sea sencilla de utilizar, de formaque facilite iteraciones rápidas en el proceso de análisis de datos; y extensible, de forma que puedaadaptarse a necesidades futuras. Posteriormente, también se describe en esta memoria unanecesidad de tratamiento de datos, así como la forma de cubrir esta necesidad aplicando labiblioteca desarrollada. YR 2018 FD 2018 LK http://uvadoc.uva.es/handle/10324/33254 UL http://uvadoc.uva.es/handle/10324/33254 LA spa DS UVaDOC RD 17-jul-2024