Statistics of non-stationary extreme values

González Ganzábal, Alejandro

Fecha

2019-09-09

Director/es

Méndez Incera, Fernando Javier

Ripoll Cabarga, Nicolás

Derechos

Atribución-NoComercial-SinDerivadas 3.0 España

Resumen/Abstract

ABSTRACT: With the objective of obtaining a model capable of determine the parameters that define a non-stationary generalised extreme value distribution, a Shuffled Complex Evolution algorithm was developed using Python 3. It was used to find the parameters that minimise the value of the log likelihood function for GEV distributions. To take seasonality into account, the parameters were built as a linear combination of sinusoidal terms to form waves, being the most complex model one with nine variables. The dataset consists of the maximum wave height per month during the years 1979-2014. In parallel with the algorithm, some tools for testing were also developed, mainly, the Fisher information matrix and the statistical tests AIC and 𝜒��2. According to the results, the model that returns the better parameters for the GEV distribution was the one with nine parameters, that is, fully non-stationary. In order to check how robust the algorithm is, a second, bigger and more varied dataset with temperature maxima was used. In this case, normalisation techniques were also used. The results were again satisfactory, opting again for a fully non-stationary model with 9 parameters.

RESUMEN: Con el objetivo de obtener un modelo capaz de obtener los parámetros que definen una distribución de valores extremos no estacionarios, se ha desarrollado utilizando herramientas para Python 3 un algoritmo del tipo Shuffled Complex Evolution para encontrar el mínimo de la función logaritmo de máxima verosimilitud. Para comprobar la estacionalidad de los valores, los tres parámetros iniciales de una distribución GEV se han construido en forma de ondas sinusoidales mediante la combinación lineal de senos y cosenos, con lo que el modelo más complejo contaría con la búsqueda del mínimo para una función de nueve variables. Los datos a evaluar constituyen máximos de altura de ola mensual entre los años 1979 y 2014. A la par que el algoritmo, se han desarrollado herramientas para testear esos resultados, fundamentalmente empleando la matriz de información de Fisher, así como los tests estadísticos AIC y 𝜒�2. A la vista de los resultados obtenidos, se concluye que el modelo que devuelve unos mejores parámetros es un modelo de nueve dimensiones, completamente no estacionario. Para comprobar la robustez del algoritmo, se utilizó un segundo dataset mucho más amplio y variado con máximos de temperatura. En este caso, se usaron también técnicas de normalización. De nuevo se obtuvieron resultados satisfactorios optando por un modelo de nueve parámetros completamente no estacionario.

Colecciones a las que pertenece

M6323 Trabajos académicos [97]

Excepto si se señala otra cosa, la licencia del ítem se describe como Atribución-NoComercial-SinDerivadas 3.0 España