La desigualdad de Azuma

Teorema de la teoría de la probabilidad

En teoría de probabilidad , la desigualdad de Azuma-Hoeffding (llamada así en honor a Kazuoki Azuma y Wassily Hoeffding ) arroja un resultado de concentración para los valores de las martingalas que tienen diferencias acotadas.

Supongamos que es una martingala (o supermartingala ) y { incógnita a : a = 0 , 1 , 2 , 3 , } {\displaystyle \{X_{k}:k=0,1,2,3,\puntos \}}

| incógnita a incógnita a 1 | do a , {\displaystyle |X_{k}-X_{k-1}|\leq c_{k},\,}

casi con seguridad . Entonces, para todos los enteros positivos N y todos los reales positivos , o {\displaystyle \épsilon}

PAG ( incógnita norte incógnita 0 o ) exp ( o 2 2 a = 1 norte do a 2 ) . {\displaystyle {\text{P}}(X_{N}-X_{0}\geq \epsilon )\leq \exp \left({-\epsilon ^{2} \sobre 2\sum _{k=1}^{N}c_{k}^{2}}\right).}

Y simétricamente (cuando X k es una sub-martingala):

PAG ( incógnita norte incógnita 0 o ) exp ( o 2 2 a = 1 norte do a 2 ) . {\displaystyle {\text{P}}(X_{N}-X_{0}\leq -\epsilon )\leq \exp \left({-\epsilon ^{2} \sobre 2\sum _{k=1}^{N}c_{k}^{2}}\right).}

Si X es una martingala, al utilizar ambas desigualdades anteriores y aplicar el límite de unión se puede obtener un límite bilateral:

PAG ( | incógnita norte incógnita 0 | o ) 2 exp ( o 2 2 a = 1 norte do a 2 ) . {\displaystyle {\text{P}}(|X_{N}-X_{0}|\geq \epsilon )\leq 2\exp \left({-\epsilon ^{2} \sobre 2\sum _{k=1}^{N}c_{k}^{2}}\right).}

Prueba

La prueba comparte una idea similar a la prueba de la forma general de la desigualdad de Azuma que se muestra a continuación. En realidad, esto puede considerarse como un corolario directo de la forma general de la desigualdad de Azuma.

Una forma general de la desigualdad de Azuma

Limitación de la desigualdad de Azuma vainilla

Nótese que la desigualdad de Azuma básica requiere límites simétricos en los incrementos de martingala, es decir , . Por lo tanto, si el límite conocido es asimétrico, por ejemplo , para utilizar la desigualdad de Azuma, se debe elegir, lo que podría ser un desperdicio de información sobre la acotación de . Sin embargo, este problema se puede resolver y se puede obtener un límite de probabilidad más estricto con la siguiente forma general de la desigualdad de Azuma. do a incógnita a incógnita a 1 do a {\displaystyle -c_{t}\leq X_{t}-X_{t-1}\leq c_{t}} a a incógnita a incógnita a 1 b a {\displaystyle a_{t}\leq X_{t}-X_{t-1}\leq b_{t}} do a = máximo ( | a a | , | b a | ) {\displaystyle c_{t}=\max(|a_{t}|,|b_{t}|)} incógnita a incógnita a 1 Estilo de visualización X_{t}-X_{t-1}}

Declaración

Sea una martingala (o supermartingala) con respecto a la filtración . Supongamos que hay procesos predecibles y con respecto a , es decir, para todos los , son - medibles y constantes tales que { incógnita 0 , incógnita 1 , } {\displaystyle \left\{X_{0},X_{1},\cdots \right\}} { F 0 , F 1 , } {\displaystyle \left\{{\mathcal {F}}_{0},{\mathcal {F}}_{1},\cdots \right\}} { A 0 , A 1 , } {\displaystyle \left\{A_{0},A_{1},\cdots \right\}} { B 0 , B 1 , } {\displaystyle \left\{B_{0},B_{1},\puntos \right\}} { F 0 , F 1 , } {\displaystyle \left\{{\mathcal {F}}_{0},{\mathcal {F}}_{1},\cdots \right\}} a {\estilo de visualización t} A a , B a Estilo de visualización A_{t}, B_{t}} F a 1 {\displaystyle {\mathcal {F}}_{t-1}} 0 < do 1 , do 2 , < {\displaystyle 0<c_{1},c_{2},\cdots <\infty }

A a incógnita a incógnita a 1 B a y B a A a do a {\displaystyle A_{t}\leq X_{t}-X_{t-1}\leq B_{t}\quad {\text{y}}\quad B_{t}-A_{t}\leq c_{t}}

Casi seguro. Entonces para todos , o > 0 {\displaystyle \epsilon >0}

PAG ( incógnita norte incógnita 0 o ) exp ( 2 o 2 a = 1 norte do a 2 ) . {\displaystyle {\text{P}}(X_{n}-X_{0}\geq \epsilon )\leq \exp \left(-{\frac {2\epsilon ^{2}}{\sum _{t=1}^{n}c_{t}^{2}}}\right).}

Como una submartingala es una supermartingala con signos invertidos, tenemos que si en cambio es una martingala (o submartingala), { incógnita 0 , incógnita 1 , } {\displaystyle \left\{X_{0},X_{1},\puntos \right\}}

PAG ( incógnita norte incógnita 0 o ) exp ( 2 o 2 a = 1 norte do a 2 ) . {\displaystyle {\text{P}}(X_{n}-X_{0}\leq -\epsilon )\leq \exp \left(-{\frac {2\epsilon ^{2}}{\sum _{t=1}^{n}c_{t}^{2}}}\right).}

Si es una martingala, ya que es a la vez supermartingala y submartingala, al aplicar el límite de unión a las dos desigualdades anteriores, podríamos obtener el límite bilateral: { incógnita 0 , incógnita 1 , } {\displaystyle \left\{X_{0},X_{1},\puntos \right\}}

PAG ( | incógnita norte incógnita 0 | o ) 2 exp ( 2 o 2 a = 1 norte do a 2 ) . {\displaystyle {\text{P}}(|X_{n}-X_{0}|\geq \epsilon )\leq 2\exp \left(-{\frac {2\epsilon ^{2}}{\sum _{t=1}^{n}c_{t}^{2}}}\right).}

Prueba

Probaremos el caso de la supermartingala solo porque el resto es evidente. Por descomposición de Doob , podríamos descomponer la supermartingala como donde es una martingala y es una secuencia predecible no creciente (nótese que si en sí es una martingala, entonces ). De , tenemos { X t } {\displaystyle \left\{X_{t}\right\}} X t = Y t + Z t {\displaystyle X_{t}=Y_{t}+Z_{t}} { Y t , F t } {\displaystyle \left\{Y_{t},{\mathcal {F}}_{t}\right\}} { Z t , F t } {\displaystyle \left\{Z_{t},{\mathcal {F}}_{t}\right\}} { X t } {\displaystyle \left\{X_{t}\right\}} Z t = 0 {\displaystyle Z_{t}=0} A t X t X t 1 B t {\displaystyle A_{t}\leq X_{t}-X_{t-1}\leq B_{t}}

( Z t Z t 1 ) + A t Y t Y t 1 ( Z t Z t 1 ) + B t {\displaystyle -(Z_{t}-Z_{t-1})+A_{t}\leq Y_{t}-Y_{t-1}\leq -(Z_{t}-Z_{t-1})+B_{t}}

Aplicando el límite de Chernoff a , tenemos para , Y n Y 0 {\displaystyle Y_{n}-Y_{0}} ϵ > 0 {\displaystyle \epsilon >0}

P ( Y n Y 0 ϵ ) min s > 0   e s ϵ E [ e s ( Y n Y 0 ) ] = min s > 0   e s ϵ E [ exp ( s t = 1 n ( Y t Y t 1 ) ) ] = min s > 0   e s ϵ E [ exp ( s t = 1 n 1 ( Y t Y t 1 ) ) E [ exp ( s ( Y n Y n 1 ) ) F n 1 ] ] {\displaystyle {\begin{aligned}{\text{P}}(Y_{n}-Y_{0}\geq \epsilon )&\leq {\underset {s>0}{\min }}\ e^{-s\epsilon }\mathbb {E} [e^{s(Y_{n}-Y_{0})}]\\&={\underset {s>0}{\min }}\ e^{-s\epsilon }\mathbb {E} \left[\exp \left(s\sum _{t=1}^{n}(Y_{t}-Y_{t-1})\right)\right]\\&={\underset {s>0}{\min }}\ e^{-s\epsilon }\mathbb {E} \left[\exp \left(s\sum _{t=1}^{n-1}(Y_{t}-Y_{t-1})\right)\mathbb {E} \left[\exp \left(s(Y_{n}-Y_{n-1})\right)\mid {\mathcal {F}}_{n-1}\right]\right]\end{aligned}}}

Para el término de expectativa interna, ya que

(i) como es una martingala; E [ Y t Y t 1 F t 1 ] = 0 {\displaystyle \mathbb {E} [Y_{t}-Y_{t-1}\mid {\mathcal {F}}_{t-1}]=0} { Y t } {\displaystyle \left\{Y_{t}\right\}}

(ii) ; ( Z t Z t 1 ) + A t Y t Y t 1 ( Z t Z t 1 ) + B t {\displaystyle -(Z_{t}-Z_{t-1})+A_{t}\leq Y_{t}-Y_{t-1}\leq -(Z_{t}-Z_{t-1})+B_{t}}

(iii) y son ambos -mensurables ya que es un proceso predecible; ( Z t Z t 1 ) + A t {\displaystyle -(Z_{t}-Z_{t-1})+A_{t}} ( Z t Z t 1 ) + B t {\displaystyle -(Z_{t}-Z_{t-1})+B_{t}} F t 1 {\displaystyle {\mathcal {F}}_{t-1}} { Z t } {\displaystyle \left\{Z_{t}\right\}}

(iv) ; B t A t c t {\displaystyle B_{t}-A_{t}\leq c_{t}}

Aplicando el lema de Hoeffding [nota 1] , tenemos

E [ exp ( s ( Y t Y t 1 ) ) F t 1 ] exp ( s 2 ( B t A t ) 2 8 ) exp ( s 2 c t 2 8 ) . {\displaystyle \mathbb {E} \left[\exp \left(s(Y_{t}-Y_{t-1})\right)\mid {\mathcal {F}}_{t-1}\right]\leq \exp \left({\frac {s^{2}(B_{t}-A_{t})^{2}}{8}}\right)\leq \exp \left({\frac {s^{2}c_{t}^{2}}{8}}\right).}

Repitiendo este paso, se podría obtener

P ( Y n Y 0 ϵ ) min s > 0   e s ϵ exp ( s 2 t = 1 n c t 2 8 ) . {\displaystyle {\text{P}}(Y_{n}-Y_{0}\geq \epsilon )\leq {\underset {s>0}{\min }}\ e^{-s\epsilon }\exp \left({\frac {s^{2}\sum _{t=1}^{n}c_{t}^{2}}{8}}\right).}

Nótese que el mínimo se alcanza en , por lo que tenemos s = 4 ϵ t = 1 n c t 2 {\displaystyle s={\frac {4\epsilon }{\sum _{t=1}^{n}c_{t}^{2}}}}

P ( Y n Y 0 ϵ ) exp ( 2 ϵ 2 t = 1 n c t 2 ) . {\displaystyle {\text{P}}(Y_{n}-Y_{0}\geq \epsilon )\leq \exp \left(-{\frac {2\epsilon ^{2}}{\sum _{t=1}^{n}c_{t}^{2}}}\right).}

Finalmente, dado que y como no es creciente, entonces el evento implica , y por lo tanto X n X 0 = ( Y n Y 0 ) + ( Z n Z 0 ) {\displaystyle X_{n}-X_{0}=(Y_{n}-Y_{0})+(Z_{n}-Z_{0})} Z n Z 0 0 {\displaystyle Z_{n}-Z_{0}\leq 0} { Z n } {\displaystyle \left\{Z_{n}\right\}} { X n X 0 ϵ } {\displaystyle \left\{X_{n}-X_{0}\geq \epsilon \right\}} { Y n Y 0 ϵ } {\displaystyle \left\{Y_{n}-Y_{0}\geq \epsilon \right\}}

P ( X n X 0 ϵ ) P ( Y n Y 0 ϵ ) exp ( 2 ϵ 2 t = 1 n c t 2 ) . {\displaystyle {\text{P}}(X_{n}-X_{0}\geq \epsilon )\leq {\text{P}}(Y_{n}-Y_{0}\geq \epsilon )\leq \exp \left(-{\frac {2\epsilon ^{2}}{\sum _{t=1}^{n}c_{t}^{2}}}\right).\square }

Observación

Tenga en cuenta que al establecer , podríamos obtener la desigualdad de Azuma original. A t = c t , B t = c t {\displaystyle A_{t}=-c_{t},B_{t}=c_{t}}

Tenga en cuenta que, tanto en el caso de la submartingala como en el de la supermartingala, solo se cumple un lado de la desigualdad de Azuma. No podemos decir mucho sobre la velocidad a la que aumenta una submartingala con incrementos acotados (o a la velocidad a la que disminuye una supermartingala).

Esta forma general de la desigualdad de Azuma aplicada a la martingala de Doob da como resultado la desigualdad de McDiarmid, que es común en el análisis de algoritmos aleatorios .


Ejemplo sencillo de la desigualdad de Azuma para lanzamientos de moneda

Sea F i una secuencia de lanzamientos de moneda aleatorios independientes e idénticamente distribuidos (es decir, sea F i igualmente probable que sea −1 o 1 independientemente de los otros valores de F i ). Definiendo se obtiene una martingala con | X k  −  X k −1 | ≤ 1, lo que nos permite aplicar la desigualdad de Azuma. Específicamente, obtenemos X i = j = 1 i F j {\displaystyle X_{i}=\sum _{j=1}^{i}F_{j}}

P ( X n > t ) exp ( t 2 2 n ) . {\displaystyle \operatorname {P} (X_{n}>t)\leq \exp \left({\frac {-t^{2}}{2n}}\right).}

Por ejemplo, si establecemos t como proporcional a n , esto nos dice que, aunque el valor máximo posible de X n escala linealmente con n , la probabilidad de que la suma escale linealmente con n disminuye exponencialmente rápido con  n .

Si establecemos obtenemos: t = 2 n ln n {\displaystyle t={\sqrt {2n\ln n}}}

P ( X n > 2 n ln n ) 1 n , {\displaystyle \operatorname {P} \left(X_{n}>{\sqrt {2n\ln n}}\right)\leq {\frac {1}{n}},}

lo que significa que la probabilidad de desviarse más se acerca a 0 cuando n tiende a infinito. 2 n ln n {\displaystyle {\sqrt {2n\ln n}}}

Observación

Sergei Bernstein demostró una desigualdad similar bajo supuestos más débiles en 1937.

Hoeffding demostró este resultado para variables independientes en lugar de diferencias de martingala, y también observó que ligeras modificaciones de su argumento establecen el resultado para diferencias de martingala (véase la página 9 de su artículo de 1963).

Véase también

Notas

  1. ^ Sin embargo, no se trata de una aplicación directa del lema de Hoeffding. El enunciado del lema de Hoeffding se ocupa de la expectativa total, pero también es válido para el caso en que la expectativa es condicional y los límites son mensurables con respecto al cuerpo sigma al que está condicionada la expectativa condicional. La prueba es la misma que para el lema de Hoeffding clásico.

Referencias

  • Alon, N.; Spencer, J. (1992). El método probabilístico . Nueva York: Wiley.
  • Azuma, K. (1967). "Sumas ponderadas de ciertas variables aleatorias dependientes" (PDF) . Tôhoku Mathematical Journal . 19 (3): 357–367. doi : 10.2748/tmj/1178243286 . MR  0221571.
  • Bernstein, Sergei N. (1937). О некоторых модификациях неравенства Чебышёва[Sobre ciertas modificaciones de la desigualdad de Chebyshev]. Doklady Akademii Nauk SSSR (en ruso). 17 (6): 275–277.(vol. 4, ítem 22 de las obras completas)
  • McDiarmid, C. (1989). "Sobre el método de diferencias acotadas". Surveys in Combinatorics . London Math. Soc. Lectures Notes 141. Cambridge: Cambridge Univ. Press. págs. 148–188. MR  1036755.
  • Hoeffding, W. (1963). "Desigualdades de probabilidad para sumas de variables aleatorias acotadas". Revista de la Asociación Estadounidense de Estadística . 58 (301): 13–30. doi :10.2307/2282952. JSTOR  2282952. MR  0144363.
  • Godbole, AP; Hitczenko, P. (1998). "Más allá del método de diferencias acotadas". Microencuestas en probabilidad discreta . Serie DIMACS en matemáticas discretas y ciencias de la computación teórica. Vol. 41. págs. 43–58. doi :10.1090/dimacs/041/03. ISBN 9780821808276.Señor 1630408  .
Retrieved from "https://en.wikipedia.org/w/index.php?title=Azuma%27s_inequality&oldid=1225086729"