Cálculo eficiente de SHAP para modelos de redes bayesianas gaussianas
Efficient computation of SHAP values for Gaussian bayesian network models
Ver/ Abrir
Identificadores
URI: https://hdl.handle.net/10902/37755Registro completo
Mostrar el registro completo DCAutoría
Buergo Lagunas, Jose RamónFecha
2025-09Director/es
Derechos
Attribution-NonCommercial-NoDerivatives 4.0 International
Resumen/Abstract
Este Trabajo de Fin de Máster estudia la relación entre la teoría de juegos y la inteligencia artificial explicable (XAI), con un enfoque específico en el cálculo de los valores de Shapley en redes bayesianas gaussianas (RBGs). Aunque estos valores ofrecen un marco sólido para atribuir la contribución de cada variable, su cálculo suele ser inviable debido al gran número de coaliciones necesarias. El objetivo principal es aprovechar las propiedades estructurales y estadísticas de las RBGs para proponer un marco teórico y computacional que permita un cálculo exacto y eficiente de los valores de SHAP. A través del uso de entornos de Markov y de la estructura local de las distribuciones condicionales, se logra reducir de manera significativa la complejidad del problema, haciéndolo escalable a modelos de mayor tamaño.
El documento se organiza en cuatro capítulos. El Capítulo 1 presenta y sitúa el problema dentro del ámbito de la inteligencia artificial explicable. El Capítulo 2 desarrolla los fundamentos teóricos sobre las redes bayesianas gaussianas, describiendo sus bases probabilísticas, propiedades clave y principios de inferencia, con especial atención a las independencias condicionales. El Capítulo 3 constituye la aportación principal, al apoyarse en la representación canónica de las RBGs y en sus CPDs lineales gaussianas junto con los entornos de Markov para establecer una solución cerrada de los valores de SHAP. Además, se muestra que las variables irrelevantes reciben contribuciones nulas y se propone un algoritmo eficiente basado en la forma canónica y la estructura local de las CPDs. Este procedimiento evita tanto la evaluación sobre múltiples coaliciones como la inversión de grandes matrices de covarianzas, ofreciendo una solución computacionalmente viable. El Capítulo 4 ilustra la implementación práctica del marco propuesto mediante una serie de experimentos con datos reales y sintéticos. Los conjuntos de datos de Wine Quality (tinto y blanco) se utilizan para mostrar la interpretabilidad en escenarios reales, mientras que las redes sintéticas sirven para validar empíricamente las cotas de complejidad teórica.
En conclusión, este trabajo demuestra que SHAP en redes bayesianas gaussianas puede obtenerse de un modo eficiente gracias a la explotación de sus propiedades estructurales. El método propuesto no solo confirma los resultados teóricos, sino que también ofrece una estrategia computacionalmente viable para aplicar explicaciones basadas en Shapley en la práctica, incluso en modelos de mayor escala.
This Master’s Project explores the connection between game theory and explainable artificial intelligence (XAI), focusing on the computation of Shapley values in Gaussian Bayesian Networks (GBNs). Shapley values provide a principled framework for attributing the contribution of each variable, but their computation is often prohibitive due to the large number of coalitions required. The main goal of this work is to exploit the structural and statistical properties of GBNs to establish a theoretical and computational framework that enables the exact and efficient calculation of Shapley values. By leveraging the concept of Markov blankets and the local structure of conditional distributions, this approach significantly reduces the complexity of the problem, making the method scalable to realistic scenarios.
The document is organized into four chapters. Chapter 1 introduces the motivation of the study, situating the problem within explainable machine learning and highlighting the limitations of current approaches to Shapley value computation. It also outlines the objectives and the methodological perspective adopted. Chapter 2 provides the theoretical background on Gaussian Bayesian networks, describing their probabilistic foundations, key properties, and inference principles, with emphasis on conditional independencies and the advantages of the multivariate normal assumption. Chapter 3 constitutes the central contribution, building on the canonical representation of GBNs and exploiting their linear Gaussian CPDs alongside the properties of Markov blankets to establish a closed-form solution for Shapley values. In this framework, SHAP is introduced for Gaussian Bayesian Networks, showing that irrelevant variables receive null contributions and deriving an efficient algorithm based on a key identity of the canonical form and the local CPD structure. This procedure avoids costly evaluation over multiple coalitions and the inversion of the full covariance matrix, thereby providing a tractable solution. Chapter 4 illustrates the practical implementation of the framework through a series of experiments on both real and synthetic data. The Wine Quality datasets (red and white) are used to showcase interpretability in real-world scenarios, while synthetic networks serve to empirically validate the theoretical complexity bounds.
In conclusion, this work shows that Shapley values in Gaussian Bayesian Networks can be obtained exactly and efficiently by exploiting their structural properties. The proposed method not only confirms the theoretical results but also offers a computationally viable strategy for applying Shapley-based explanations in practice, even for larger-scale models.








