Análisis y predicción de series temporales para consumo eléctrico y presión en el supercomputador Finis Terrae II mediante el uso de Spark
Analysis and prediction of time series for electric power consumption and pressure on the Finis Terrae II supercomputer using Spark
Ver/ Abrir
Identificadores
URI: https://hdl.handle.net/10902/30825Registro completo
Mostrar el registro completo DCAutoría
Moro Carrera, LuisFecha
2023-09Director/es
Derechos
Attribution-NonCommercial-NoDerivatives 4.0 International
Palabras clave
Predicción de series temporales
Apache Spark
Machine learning
Data science
Time series forecasting
Resumen/Abstract
En el contexto de los Centros de Supercomputación, la mejora de la eficiencia energética resulta de enorme importancia debido a las elevadas necesidades energéticas que se requieren para su funcionamiento, pudiendo alcanzar varios MW. Es por tanto fundamental anticipar el consumo eléctrico y el seguimiento de distintas series temporales relacionadas con el correcto funcionamiento de los sistemas de refrigeración.
Se ha realizado, en colaboración con el Centro de Supercomputacion de Galicia (CESGA), un proyecto para predecir el consumo de sus enfriadoras y la presión a la que se encuentran sometidos los compresores de estas.
Debido al elevado volumen de datos a procesar, es necesario el uso de herramientas de Big Data tales como Apache Spark y el ecosistema Apache Hadoop.
En cuanto a los modelos y su tratamiento estadístico, se han probado modelos clásicos basados en autorregresión, suavizado exponencial (Holt-Winters), Prophet y una combinación de suavizado exponencial, media móvil y autorregresión donde se introducen términos adicionales para dar cuenta de varias componentes estacionales (TBATS). Este último ha sido el modelo más adecuado en el caso de la predicción de una serie temporal de consumo energético con múltiples estacionalidades. La variante autorregresiva (SARIMA) ha sido satisfactoria para predecir la presión máxima, ya que se ha observado una clara estacionalidad y una función de autocorrelación con patrón sinusoidal.
In the context of Supercomputing Centers, the improvement of energy efficiency is of enormous importance due to the high energy needs required for their operation, which can reach several MW. It is therefore essential to anticipate the electrical consumption and the monitoring of different time series related to the correct operation of the cooling systems.
A project has been carried out in collaboration with the Supercomputing Center of Galicia (CESGA) to predict the consumption of its chillers and the pressure to which their compressors are subjected.
Due to the high volume of data to be processed, it is necessary to use Big Data tools such as Apache Spark and the Apache Hadoop ecosystem.
Regarding the models and their statistical treatment, classical models based on autoregression, exponential smoothing (Holt-Winters), Prophet and an exponential smoothing state-space model with Box-Cox transformation, ARMA errors, Trend, and Seasonal components (TBATS) were tested.
The latter has been the most suitable in the case of predicting a time series of energy consumption with multiple seasonalities. The autoregressive variant (SARIMA) has been satisfactory for predicting peak pressure, since a clear seasonality and an autocorrelation function with a sinusoidal pattern have been observed.