RT info:eu-repo/semantics/masterThesis T1 Análisis de datos y modelos de aprendizaje para monitorizar el consumo de agua en redes de abastecimiento usando tecnologías Big Data A1 Leguizamón Rojas, Gloria Ayde A2 Universidad de Valladolid. Escuela de Ingeniería Informática de Valladolid K1 Abastecimiento de agua K1 Big Data AB Todo sistema de abastecimiento de agua está integrado por una estructura compleja,en la que se llevan a cabo procesos de producción, transporte y distribución de agua, entreotros. Dichos procesos, tienen como fin satisfacer la demanda de los consumidores en tiemporeal. Ello implica proporcionar continuamente a los usuarios agua de calidad en volúmenesadecuados a una presión razonable, asegurando así una distribución de agua confiable. Portanto, el diseño de planes de mantenimiento y gestión, tanto para las condiciones actualescomo las futuras demandas que afectan las presiones en la red de tuberías -en ciudadescada vez más diversas y aglomeradas-, así como la reducción de costes para las empresas,representa una parte capital dentro de la estrategia de gestión de toda red de suministro.Para enfrentar esta necesidad, la disponibilidad de datos es imprescindible. Así, las empresasabastecedoras de agua han implementado variadas estrategias para la recolección delos mismos casi en tiempo real, donde estos son obtenidos directamente desde los sensores.Antes de esta sustancial mejora, las lecturas disponibles solían ser mensuales o bimensualesy se recopilaban in situ, lo que dificultaba el análisis adecuado del comportamiento delcliente y la evaluación para ampliar el estado de la infraestructura y mejorar su calidad.Así, en este nuevo escenario, si bien el conocimiento de los datos mejora la capacidadde anticipación a los problemas, la acumulación de toda esa información, supera los límitesde cualquier herramienta de análisis estadístico convencional. Por ello se abre, no sólo laposibilidad, sino la conveniencia, de la implementación de tecnologías Big Data.En este trabajo se plantea el procesamiento, análisis y la creación de modelos de aprendizajeautomático para monitorizar la demanda en redes de agua utilizando datos recopiladosde los sensores de caudal y presión, haciendo uso del paradigma del descubrimiento de conocimientoen base de datos (KDD), junto con el proceso extracción, carga y transformación(ELT) para la construcción del Data Lake, en un entorno Big Data.El proceso se inicia con la extracción y carga de los datos fuente, que hace partede la construcción del Data Lake. Luego se realiza el análisis de los datos en bruto conel modelado conceptual, donde se construye el diccionario de datos y se diseña el modeloentidad relación y el mapa lógico de datos que describe las características que relacionan losdatos en bruto y los datos refinados. Así, se realizan todas las transformaciones necesarias,hasta obtener el archivo que se usará en el modelo de aprendizaje y cuya estructura fuedefinida en el mapa lógico.En la etapa de aprendizaje, se usan 3 métodos de regresión disponibles en la bibliotecaML de Spark, Decision Tree, Random Forest y Gradient-boosted tree y se evalúan en losconjuntos de prueba con los parámetros óptimos obtenidos con validación cruzada.Finalmente se visualizan los resultados de las predicciones de los modelos entrenadosen la etapa de aprendizaje, usando la herramienta Qlik, donde se muestra la comparaciónde los 3 modelos entrenados y la contrastación empírica de las hipótesis propuestas. YR 2018 FD 2018 LK http://uvadoc.uva.es/handle/10324/33328 UL http://uvadoc.uva.es/handle/10324/33328 LA spa NO Departamento de Informática (Arquitectura y Tecnología de Computadores, Ciencias de la Computación e Inteligencia Artificial, Lenguajes y Sistemas Informáticos) DS UVaDOC RD 24-nov-2024