Análisis y predicción de series temporales provenientes de un sistema SCADA de una planta de fabricación industrial
Analysis and forecasting of time series from a SCADA system of an industrial manufacturing plant
Ver/ Abrir
Identificadores
URI: http://hdl.handle.net/10902/16901Registro completo
Mostrar el registro completo DCAutoría
Meneses Agudo, Carlos AlbertoFecha
2019-07-02Derechos
Atribución-NoComercial-SinDerivadas 3.0 España
Palabras clave
Series temporales
Machine learning
Data science
Industria
Time series
Industry
Resumen/Abstract
RESUMEN: En la presente memoria se recoge el trabajo realizado sobre series temporales sobre consumos energéticos y de recursos de una planta industrial. Se ha tratado de realizar un trabajo de data science completo. Se ha partido de unos datos y se ha elaborado un preprocesado y curado de los datos, así como una analítica de estos, tanto de forma cualitativa como cuantitativa.
En general, este trabajo ejemplifica, aunque de forma comedida, el trabajo de data scientist sobre un problema real, en el que debemos recolectar los datos, curarlos y preprocesarlos y obtener un cierto valor añadido sobre estos datos. En nuestro ejemplo, nos hemos centrado en tratar de obtener unas predicciones con un conjunto de modelos seleccionado. Para ello se ha tomado una ventana deslizante temporal de 8 pasos hacia el pasado para predecir un paso hacia el futuro. El principal resultado obtenido lo han conseguido dos modelos lineales: Regresión lineal y SVR con kernel lineal.
Esto resulta destacable a la hora de dar valor a estos modelos lineales que, incluso con su sencillez, en ocasiones se comportan mejor que modelos más adecuados a las características del problema. En nuestro caso se debe a que el resto de modelos complejos no han sido lo suficientemente ajustados y en esas condiciones los modelos lineales han resultado vencedores.
De cualquier forma, el valor final de este trabajo reside en todo el proceso aplicado y las líneas de trabajo futuro abiertas.
ABSTRACT: This report includes the research carried out on time series on energy and resource consumption of an industrial plant. An attempt has been made to carry out a complete data science. Some data have been used as a starting point and a preprocessing and curing of the data has been elaborated.
In general, this research exemplifies the work of a data scientist on a real problem, in which we must collect the data, cure and preprocess them and obtain a certain added value on these data. In our example, we have focused on trying to get predictions with a selected set of models. For this, we have taken a time slider window of 8 steps into the past to predict 1 step into the future. The main result obtained has been achieved by two linear models: Linear Regression and SVR with linear kernel.
This is remarkable when it comes to giving value to these linear models which, even with their simplicity, sometimes behave better than models more suited to the characteristics of the problem. In our case it is due to the fact that the rest of the complex models have not been enough adjusted. In these conditions the results of the linear models have been succesful.
In any case, the final value of this research lies in the entire process applied and the future lines of research open.