Aplicabilidad de técnicas de muestreo de importancia para contrastes de hipótesis para “descubrimientos” en física de partículas
Applicability of importance sampling techniques for hypothesis testing in “discoveries” in particle physics
Ver/ Abrir
Identificadores
URI: https://hdl.handle.net/10902/33669Registro completo
Mostrar el registro completo DCAutoría
López Fuente, ElenaFecha
2024-06Director/es
Derechos
Attribution-NonCommercial-NoDerivatives 4.0 International
Palabras clave
Contraste de hipótesis
Muestreo por importancia
Máxima verosimilitud
p-valor
Entropía cruzada
Hypothesis testing
Importance sampling
Maximum likelihood
p-value
Crossentropy
Resumen/Abstract
En el análisis estadístico, obtener p-valores bajos de manera precisa es crucial para la toma de decisiones basada en contrastes de hipótesis, aunque este cálculo puede ser complejo y costoso en términos computacionales. Este trabajo aborda este desafío implementando un método de muestreo por importancia, el cual, es una técnica de simulación que mejora la eficiencia al centrarse en las áreas más relevantes del espacio de probabilidad. Un aspecto clave de este método es la selección de la función auxiliar para pesar el muestreo. Proponemos su elección en base a la hipótesis alternativa (H1) del contraste, en particular, aquella que maximiza la verosimilitud.
Para validar este método, se han utilizado ejemplos sencillos analíticamente y simulaciones en R. También se ha aplicado el método de entropía cruzada para encontrar los parámetros óptimos del muestreo por importancia. Además, se ha comprobado la eficacia del método en distribuciones normales, exponenciales y de Poisson, mostrando una mejora significativa en la precisión del cálculo del p-valor y una reducción notoria de la varianza en comparación con métodos tradicionales. También se ha explorado la aplicación del método a contrastes de señal sobre ruido utilizando histogramas, demostrando que el método es efectivo en este contexto.
En conclusión, el método no solo se aplica a situaciones estándar, sino que también se adapta y utiliza en una amplia gama de problemas estadísticos, proporcionando una herramienta sólida y versátil para el cálculo de p-valores bajos.
In statistical analysis, obtaining low p-values accurately is crucial for decision-making based on hypothesis testing, although this calculation can be complex and computationally expensive. This paper addresses this challenge by implementing an importance sampling method which is a simulation technique that increases efficiency by focusing on the most relevant areas of the probability space. A key aspect of this method is the selection of the auxiliary function for sampling weighting. We propose its selection based on the alternative hypothesis (H1) of the hypothesis test, in particular the one that maximizes likelihood.
To validate this method, we have employed simple analytical examples and simulations in R. The cross-entropy method has also been applied to find optimal parameters for importance sampling. Furthermore, the efficacy of the method has been tested on normal, exponential, and Poisson distributions, demonstrating a significant improvement in the accuracy of p-value calculation and a noticeable reduction in variance compared to traditional methods. Additionally, the method has been explored for its application to signal-to-noise contrasts using histograms, showing effectiveness in this context as well.
In conclusion, the method not only applies to standard situations but also adapts and is used in a wide range of statistical problems, providing a robust and versatile tool for calculating low p-values.