Intervalo creíble

Concept in Bayesian statistics

En estadística bayesiana , un intervalo creíble es un intervalo utilizado para caracterizar una distribución de probabilidad . Se define de manera que un valor de parámetro no observado tenga una probabilidad particular de caer dentro de él. Por ejemplo, en un experimento que determina la distribución de valores posibles del parámetro , si la probabilidad de que se encuentre entre 35 y 45 es , entonces es un intervalo creíble del 95%. $\alpha$ $\mu$ $\mu$ $\alpha =0.95$ $35\leq \mu \leq 45$

Los intervalos creíbles se utilizan normalmente para caracterizar distribuciones de probabilidad posterior o distribuciones de probabilidad predictivas . ^[1] Su generalización a conjuntos desconectados o multivariados se denomina región creíble .

Los intervalos creíbles son un análogo bayesiano de los intervalos de confianza en las estadísticas frecuentistas . ^[2] Los dos conceptos surgen de diferentes filosofías: ^{[3] Los intervalos bayesianos tratan sus límites como fijos y el parámetro estimado como una variable aleatoria, mientras que los intervalos de confianza frecuentistas tratan sus límites como variables aleatorias y el parámetro como un valor fijo. Además, los intervalos creíbles bayesianos utilizan (y de hecho, requieren) el conocimiento de la}distribución previa específica de la situación , mientras que los intervalos de confianza frecuentistas no lo hacen.

Definiciones

Las regiones creíbles no son únicas; cualquier distribución de probabilidad dada tiene un número infinito de regiones de probabilidad creíbles . Por ejemplo, en el caso univariado, existen múltiples definiciones para un intervalo o región adecuados: $\alpha$

El intervalo más pequeño, a veces llamado intervalo de mayor densidad (IDH). Este intervalo incluirá necesariamente la mediana siempre que . Además, cuando la distribución sea unimodal , este intervalo incluirá la moda . $\alpha \geq 0.5$
La región más pequeña, a veces llamada región de mayor densidad (HDR). Para una distribución multimodal, no es necesariamente un intervalo, ya que puede estar desconectado. Esta región siempre incluirá la moda .
Un intervalo basado en cuantiles (QBI), que se calcula tomando el intervalo intercuantil para algunos . Por ejemplo, el intervalo de probabilidad de la mediana es el intervalo donde la probabilidad de estar por debajo del intervalo es tan probable como estar por encima de él, es decir, el intervalo . A veces también se lo denomina intervalo de colas iguales y siempre incluirá la mediana . Se pueden definir muchos otros QBI, como el intervalo más bajo o el intervalo más alto . Estos intervalos pueden ser más adecuados para variables acotadas. $[q_{\beta },q_{\beta +\alpha }]$ $\beta \in [0,1-\alpha ]$ $\alpha$ $[q_{(1-\alpha )/2},q_{(1+\alpha )/2}]$ $[q_{0},q_{\alpha }]$ $[q_{1-\alpha },q_{1}]$

Se puede definir el intervalo para el cual la media es el punto central, asumiendo que la media existe.

Los HDR se pueden generalizar fácilmente al caso multivariado y están delimitados por líneas de contorno de densidad de probabilidad . ^[4] Siempre contendrán la moda , pero no necesariamente la media , la mediana por coordenadas ni la mediana geométrica .

Los intervalos creíbles también se pueden estimar mediante el uso de técnicas de simulación como el método Monte Carlo de cadenas de Markov . ^[5]

Contrastes con intervalo de confianza

Un intervalo de confianza frecuentista del 95 % significa que, con una gran cantidad de muestras repetidas, el 95 % de dichos intervalos de confianza calculados incluirían el valor verdadero del parámetro. En términos frecuentistas, el parámetro es fijo (no se puede considerar que tenga una distribución de valores posibles) y el intervalo de confianza es aleatorio (ya que depende de la muestra aleatoria).

Los intervalos creíbles bayesianos se diferencian de los intervalos de confianza frecuentistas en dos aspectos principales:

Los intervalos creíbles son intervalos cuyos valores tienen una densidad de probabilidad (posterior), que representa la plausibilidad de que el parámetro tenga esos valores, mientras que los intervalos de confianza consideran que el parámetro de la población es fijo y, por lo tanto, no es objeto de probabilidad. Dentro de los intervalos de confianza, la confianza se refiere a la aleatoriedad del propio intervalo de confianza en ensayos repetidos, mientras que los intervalos creíbles analizan la incertidumbre del parámetro objetivo dados los datos disponibles.

Los intervalos creíbles y los intervalos de confianza tratan los parámetros molestos de maneras radicalmente diferentes.

Para el caso de un único parámetro y datos que se pueden resumir en una única estadística suficiente , se puede demostrar que el intervalo creíble y el intervalo de confianza coinciden si el parámetro desconocido es un parámetro de ubicación (es decir, la función de probabilidad hacia adelante tiene la forma ), con una distribución previa que es plana y uniforme; ^[6] y también si el parámetro desconocido es un parámetro de escala (es decir, la función de probabilidad hacia adelante tiene la forma ), con una distribución previa de Jeffreys ^[6] — esto último se deduce porque tomar el logaritmo de dicho parámetro de escala lo convierte en un parámetro de ubicación con una distribución uniforme. Pero estos son casos claramente especiales (aunque importantes); en general, no se puede hacer tal equivalencia. $\mathrm {Pr} (x|\mu )=f(x-\mu )$ $\mathrm {Pr} (x|s)=f(x/s)$ $\mathrm {Pr} (s|I)\;\propto \;1/s$

Referencias

^ Edwards, Ward; Lindman, Harold; Savage, Leonard J. (1963). "Inferencia estadística bayesiana en la investigación psicológica". Psychological Review . 70 (3): 193–242. doi :10.1037/h0044139.
^ Lee, PM (1997) Estadística bayesiana: una introducción , Arnold. ISBN 0-340-67785-6
^ VanderPlas, Jake. "Frecuentismo y bayesianismo III: confianza, credibilidad y por qué el frecuentismo y la ciencia no se mezclan | Pythonic Perambulations". jakevdp.github.io .
^ O'Hagan, A. (1994) Teoría avanzada de las estadísticas de Kendall, vol. 2B, Inferencia bayesiana , sección 2.51. Arnold, ISBN 0-340-52922-9
^ Chen, Ming-Hui; Shao, Qi-Man (1 de marzo de 1999). "Estimación de Monte Carlo de intervalos bayesianos creíbles y HPD". Journal of Computational and Graphical Statistics . 8 (1): 69–92. doi :10.1080/10618600.1999.10474802.
^ ab Jaynes, ET (1976). "Intervalos de confianza frente a intervalos bayesianos", en Fundamentos de la teoría de la probabilidad, la inferencia estadística y las teorías estadísticas de la ciencia , (WL Harper y CA Hooker, eds.), Dordrecht: D. Reidel, págs. 175 y siguientes

Lectura adicional

Morey, RD; Hoekstra, R.; Rouder, JN; Lee, MD; Wagenmakers, E.-J. (2016). "La falacia de depositar la confianza en los intervalos de confianza". Psychonomic Bulletin & Review . 23 (1): 103–123. doi :10.3758/s13423-015-0947-8. PMC 4742505 . PMID 26450628.

[1] Edwards, Ward; Lindman, Harold; Savage, Leonard J. (1963). "Inferencia estadística bayesiana en la investigación psicológica". Psychological Review . 70 (3): 193–242. doi :10.1037/h0044139.

[2] Lee, PM (1997) Estadística bayesiana: una introducción , Arnold. ISBN 0-340-67785-6

[VanderPlas2014-3] VanderPlas, Jake. "Frecuentismo y bayesianismo III: confianza, credibilidad y por qué el frecuentismo y la ciencia no se mezclan | Pythonic Perambulations". jakevdp.github.io .

[4] O'Hagan, A. (1994) Teoría avanzada de las estadísticas de Kendall, vol. 2B, Inferencia bayesiana , sección 2.51. Arnold, ISBN 0-340-52922-9

[Chen1999-5] Chen, Ming-Hui; Shao, Qi-Man (1 de marzo de 1999). "Estimación de Monte Carlo de intervalos bayesianos creíbles y HPD". Journal of Computational and Graphical Statistics . 8 (1): 69–92. doi :10.1080/10618600.1999.10474802.

[Jaynes_1976-6] Jaynes, ET (1976). "Intervalos de confianza frente a intervalos bayesianos", en Fundamentos de la teoría de la probabilidad, la inferencia estadística y las teorías estadísticas de la ciencia , (WL Harper y CA Hooker, eds.), Dordrecht: D. Reidel, págs. 175 y siguientes