Modelos gráficos probabilísticos para modelización de relaciones causales en clima
Probabilistic networks for modeling causal relationships in clime
Ver/ Abrir
Identificadores
URI: https://hdl.handle.net/10902/29865Registro completo
Mostrar el registro completo DCAutoría
Melendi Ortega, CeliaFecha
2023-07Derechos
Attribution-NonCommercial-NoDerivatives 4.0 International
Palabras clave
Redes probabilísticas
Aprendizaje automático
Causalidad
Clima
Temperatura global
Teleconexiones
Probabilistic networks
Machine learning
Causality
Climate
Global temperature
Teleconnections
Resumen/Abstract
Las redes probabilísticas son técnicas de aprendizaje automático basadas en probabilidad que permiten modelar problemas multivariados a partir de conjuntos de datos. Estos modelos utilizan grafos para extraer y representar de forma automática las relaciones relevantes entre las variables, y probabilidad para definir una probabilidad conjunta consistente con las dependencias. Estas técnicas han sido aplicadas exitosamente en distintas disciplinas, pero su aplicación en clima es reciente y limitada. En este trabajo de fin de grado se ha explorado la aplicación de las redes probabilísticas
para la modelización de datos climáticos (en particular datos globales de temperatura para un período de 30 años) y la identificación de causalidad en teleconexiones (correlaciones de largo alcance). Para ello se han estudiado los métodos más extendidos para detectar causalidad en series temporales, en particular causalidad de Granger y nuevas técnicas empíricas basadas en redes probabilísticas dinámicas. Para problemas de alta dimensionalidad (como el problema de clima tratado en este trabajo) se ha visto que las redes probabilísticas dinámicas ofrecen una metodología eficiente, que permite identificar teleconexiones que están de acuerdo con el conocimiento de causalidad que se tiene del problema.
Probabilistic networks are probability-based machine learning techniques for modelling multivariate problems from data. These models use graphs to automatically extract and represent the relevant relationships between variables, and probability to define a joint probability consistent with the dependencies. These techniques have been successfully applied in different disciplines, but their application in climate is recent and limited.
This thesis has explored the application of probabilistic networks to model climate data (in particular global temperature data for a 30-year period) and to identify causality in teleconnections (long-range correlations). For this purpose, the most widespread methods for detecting causality in time series have been studied, in particular Granger causality and new empirical techniques based on dynamic probabilistic networks. For high-dimensional problems (such as the climate problem discussed in this work), dynamic probabilistic networks have been found to offer an efficient methodology, which allows us to identify teleconnections that coincide with the knowledge of causality that we have of the problem.