Predicción con datos SCADA de series temporales
Time series forecasting for SCADA data
Ver/ Abrir
Identificadores
URI: http://hdl.handle.net/10902/20984Registro completo
Mostrar el registro completo DCAutoría
Martínez-Conde Salamanca, MiguelFecha
2020-06Derechos
Atribución-NoComercial-SinDerivadas 3.0 España
Palabras clave
Series temporales
SCADA
Machine learning
Predicción
Time series
Forecasting
Resumen/Abstract
RESUMEN: El análisis de series temporales ha adquirido un gran protagonismo en el ámbito académico dadas sus implicaciones en áreas como la ingeniería, las finanzas o las ciencias sociales. El objetivo en este caso no es ahondar en dicho ámbito, sino trasladarlo a un entorno industrial con series temporales que presentan características más dispares y, en ocasiones, intermitencias.
En la presente memoria se realiza una implementación de varios modelos de machine learning acerca de datos SCADA (Supervisory Control And Data Acquisition) de series temporales referidas a consumos de energía en una planta industrial con el objetivo de evaluar sus resultados para la toma de decisiones operativas en este contexto. Los modelos que se implementarán, previa aplicación de técnicas de curación y preprocesado de datos, serán máquinas de vectores soporte, modelos aditivos generalizados y modelos de ensembles en sus vertientes de bagging y boosting. Un modelo final será propuesto como una combinación de todos los anteriores adoptando de nuevo una metodología de ensembles y los modelos stacking, mediante la estimación de un meta-modelo.
En última instancia, se elaborar án las predicciones para diferentes horizontes temporales que permitan obtener conclusiones sobre la viabilidad de la aplicación de estas técnicas en un ámbito centrado en la toma de decisiones operativas y que contribuya de forma aditiva a un análisis similar como el elaborado por Meneses Agudo et al. (2019).
ABSTRACT: Time series analysis has gained weight in the academic literature because of its growing penetration in areas such as engineering, finance or social sciences. The objective of the present thesis is not to research further and get a deeper look at these techniques, but rather translate their application to the industrial sector, in time series with heterogenous characteristics and, in some occasions, and intemittent behaviour.
In this thesis we implement several machine learning models to time series of SCADA data (Supervisory Control and Data Acquisition) referring to energy consumption in an industrial plant, with the objective to evaluate the appropiateness of their results in order to improve the firm’s decision making. Previous to the application of these models, curation and preprocessing techniques will be applied to the data. The specific models applied are Support Vector Machines, Generalized Additive Models and Ensembles models in their bagging and boosting variations. A final model will be propposed as a combination of the mentioned models through a new ensembles methodoloy and stacking models, with the estimation of a meta-model.