La distancia de Wasserstein. Análisis de la relación entre la temperatura del planeta y el nivel de CO₂
Wasserstein’s distance. Analysis of the relationship between global temperature and the level of CO₂
Identificadores
URI: https://hdl.handle.net/10902/27342Registro completo
Mostrar el registro completo DCAutoría
Diego Velarde, AlbaFecha
2022-09-06Director/es
Derechos
Atribución-NoComercial-SinDerivadas 3.0 España
Palabras clave
Transporte óptimo
Distancia de Wasserstein
Media de Fréchet
Regresión no paramétrica
Distribución de probabilidad
Cuantil, Temperatura
CO₂
Optimal transport
Wasserstein distance
Fréchet mean
Nonparametric regression
Probability distribution
Quantile
Temperature
Resumen/Abstract
El problema del transporte óptimo fue propuesto por Monge y consiste en transformar una distribución en otra minimizando el coste de transporte. Kantorovich presentó una relajación del problema de Monge que permitió probar la existencia y unicidad de solución del problema bajo ciertas condiciones. Este problema introduce de manera natural una distancia entre distribuciones, la distancia de Wasserstein, que se define como el coste mínimo de transporte entre ellas. A su vez, esta distancia permite definir la media de Fréchet, que es una generalización a espacios métricos de la media usual. Con estas herramientas, en el presente trabajo se propone un modelo de regresión no paramétrica funcional basado en núcleos que relaciona las distribuciones anuales (de 1954 a 2021) de las diferencias entre la temperatura media diaria de la superficie terrestre y la temperatura media entre 1951 y 1980, con las concentraciones anuales de CO₂ en la atmósfera. Se estiman las distribuciones de probabilidad esperadas para cada año en base al nivel de CO₂ de ese año.
The optimal transportation problem was proposed by Monge and consists of transforming one distribution into another while minimizing the transportation cost. Kantorovich presented a relaxation of Monge’s problem which made it possible to prove the existence and uniqueness of solution of the problem under certain conditions. This problem naturally introduces a distance between distributions, the Wasserstein distance, which is defined as the minimum transport cost between them. In turn, this distance allows us to define the Fréchet mean, which is a generalization to metric spaces of the usual mean. With these tools, in the present work we propose a functional nonparametric regression model based on kernels that relates the annual distributions (from 1954 to 2021) of the differences between the mean daily land surface temperature and the mean temperature between 1951 and 1980, with the annual concentrations of CO₂ in the atmosphere. Expected probability distributions are estimated for each year based on that year’s CO₂ level.