Desigualdad de Boole

Desigualdad aplicada a espacios de probabilidad

En teoría de la probabilidad , la desigualdad de Boole , también conocida como límite de unión , dice que para cualquier conjunto finito o contable de eventos , la probabilidad de que ocurra al menos uno de los eventos no es mayor que la suma de las probabilidades de los eventos individuales. Esta desigualdad proporciona un límite superior a la probabilidad de ocurrencia de al menos uno de un número contable de eventos en términos de las probabilidades individuales de los eventos. La desigualdad de Boole recibe su nombre de su descubridor, George Boole . [1]

Formalmente, para un conjunto contable de eventos A 1 , A 2 , A 3 , ..., tenemos

P ( i = 1 A i ) i = 1 P ( A i ) . {\displaystyle {\mathbb {P} }\left(\bigcup _{i=1}^{\infty }A_{i}\right)\leq \sum _{i=1}^{\infty }{\mathbb {P} }(A_{i}).}

En términos de teoría de la medida , la desigualdad de Boole se deduce del hecho de que una medida (y ciertamente cualquier medida de probabilidad ) es σ - subaditiva .

Prueba

Prueba mediante inducción

La desigualdad de Boole puede demostrarse para colecciones finitas de eventos utilizando el método de inducción. n {\displaystyle n}

Para el caso, se deduce que n = 1 {\displaystyle n=1}

P ( A 1 ) P ( A 1 ) . {\displaystyle \mathbb {P} (A_{1})\leq \mathbb {P} (A_{1}).}

Para el caso , tenemos n {\displaystyle n}

P ( i = 1 n A i ) i = 1 n P ( A i ) . {\displaystyle {\mathbb {P} }\left(\bigcup _{i=1}^{n}A_{i}\right)\leq \sum _{i=1}^{n}{\mathbb {P} }(A_{i}).}

Dado que y porque el funcionamiento sindical es asociativo , tenemos P ( A B ) = P ( A ) + P ( B ) P ( A B ) , {\displaystyle \mathbb {P} (A\cup B)=\mathbb {P} (A)+\mathbb {P} (B)-\mathbb {P} (A\cap B),}

P ( i = 1 n + 1 A i ) = P ( i = 1 n A i ) + P ( A n + 1 ) P ( i = 1 n A i A n + 1 ) . {\displaystyle \mathbb {P} \left(\bigcup _{i=1}^{n+1}A_{i}\right)=\mathbb {P} \left(\bigcup _{i=1}^{n}A_{i}\right)+\mathbb {P} (A_{n+1})-\mathbb {P} \left(\bigcup _{i=1}^{n}A_{i}\cap A_{n+1}\right).}

Desde

P ( i = 1 n A i A n + 1 ) 0 , {\displaystyle {\mathbb {P} }\left(\bigcup _{i=1}^{n}A_{i}\cap A_{n+1}\right)\geq 0,}

por el primer axioma de probabilidad , tenemos

P ( i = 1 n + 1 A i ) P ( i = 1 n A i ) + P ( A n + 1 ) , {\displaystyle \mathbb {P} \left(\bigcup _{i=1}^{n+1}A_{i}\right)\leq \mathbb {P} \left(\bigcup _{i=1}^{n}A_{i}\right)+\mathbb {P} (A_{n+1}),}

y por lo tanto

P ( i = 1 n + 1 A i ) i = 1 n P ( A i ) + P ( A n + 1 ) = i = 1 n + 1 P ( A i ) . {\displaystyle \mathbb {P} \left(\bigcup _{i=1}^{n+1}A_{i}\right)\leq \sum _{i=1}^{n}\mathbb {P} (A_{i})+\mathbb {P} (A_{n+1})=\sum _{i=1}^{n+1}\mathbb {P} (A_{i}).}

Demostración sin utilizar inducción

Para cualquier evento en nuestro espacio de probabilidad tenemos A 1 , A 2 , A 3 , {\displaystyle A_{1},A_{2},A_{3},\dots }

P ( i A i ) i P ( A i ) . {\displaystyle \mathbb {P} \left(\bigcup _{i}A_{i}\right)\leq \sum _{i}\mathbb {P} (A_{i}).}

Uno de los axiomas de un espacio de probabilidad es que si son subconjuntos disjuntos del espacio de probabilidad entonces B 1 , B 2 , B 3 , {\displaystyle B_{1},B_{2},B_{3},\dots }

P ( i B i ) = i P ( B i ) ; {\displaystyle \mathbb {P} \left(\bigcup _{i}B_{i}\right)=\sum _{i}\mathbb {P} (B_{i});}

Esto se llama aditividad contable.

Si modificamos los conjuntos para que sean disjuntos, A i {\displaystyle A_{i}}

B i = A i j = 1 i 1 A j {\displaystyle B_{i}=A_{i}-\bigcup _{j=1}^{i-1}A_{j}}

Podemos demostrar que

i = 1 B i = i = 1 A i . {\displaystyle \bigcup _{i=1}^{\infty }B_{i}=\bigcup _{i=1}^{\infty }A_{i}.}

probando ambas direcciones de inclusión.

Supongamos que . Entonces, para algún mínimo tal que . Por lo tanto . Por lo tanto, la primera inclusión es verdadera: . x i = 1 A i {\displaystyle x\in \bigcup _{i=1}^{\infty }A_{i}} x A k {\displaystyle x\in A_{k}} k {\displaystyle k} i < k x A i {\displaystyle i<k\implies x\notin A_{i}} x B k = A k j = 1 k 1 A j {\displaystyle x\in B_{k}=A_{k}-\bigcup _{j=1}^{k-1}A_{j}} i = 1 A i i = 1 B i {\displaystyle \bigcup _{i=1}^{\infty }A_{i}\subset \bigcup _{i=1}^{\infty }B_{i}}

Supongamos ahora que . De ello se deduce que para algún . Y entonces , y tenemos la otra inclusión: . x i = 1 B i {\displaystyle x\in \bigcup _{i=1}^{\infty }B_{i}} x B k {\displaystyle x\in B_{k}} k {\displaystyle k} B k = A k j = 1 k 1 A j {\displaystyle B_{k}=A_{k}-\bigcup _{j=1}^{k-1}A_{j}} x A k {\displaystyle x\in A_{k}} i = 1 B i i = 1 A i {\displaystyle \bigcup _{i=1}^{\infty }B_{i}\subset \bigcup _{i=1}^{\infty }A_{i}}

Por construcción de cada , . Porque es el caso que B i {\displaystyle B_{i}} B i A i {\displaystyle B_{i}\subset A_{i}} B A , {\displaystyle B\subset A,} P ( B ) P ( A ) . {\displaystyle \mathbb {P} (B)\leq \mathbb {P} (A).}

Entonces, podemos concluir que la desigualdad buscada es verdadera:

P ( i A i ) = P ( i B i ) = i P ( B i ) i P ( A i ) . {\displaystyle \mathbb {P} \left(\bigcup _{i}A_{i}\right)=\mathbb {P} \left(\bigcup _{i}B_{i}\right)=\sum _{i}\mathbb {P} (B_{i})\leq \sum _{i}\mathbb {P} (A_{i}).}

Desigualdades de Bonferroni

La desigualdad de Boole puede generalizarse para encontrar límites superior e inferior en la probabilidad de uniones finitas de eventos. [2] Estos límites se conocen como desigualdades de Bonferroni , en honor a Carlo Emilio Bonferroni ; véase Bonferroni (1936).

Dejar

S 1 := i = 1 n P ( A i ) , S 2 := 1 i 1 < i 2 n P ( A i 1 A i 2 ) , , S k := 1 i 1 < < i k n P ( A i 1 A i k ) {\displaystyle S_{1}:=\sum _{i=1}^{n}{\mathbb {P} }(A_{i}),\quad S_{2}:=\sum _{1\leq i_{1}<i_{2}\leq n}{\mathbb {P} }(A_{i_{1}}\cap A_{i_{2}}),\quad \ldots ,\quad S_{k}:=\sum _{1\leq i_{1}<\cdots <i_{k}\leq n}{\mathbb {P} }(A_{i_{1}}\cap \cdots \cap A_{i_{k}})}

para todos los enteros k en {1, ..., n }.

Entonces, cuando es impar: K n {\displaystyle K\leq n}

j = 1 K ( 1 ) j 1 S j P ( i = 1 n A i ) = j = 1 n ( 1 ) j 1 S j {\displaystyle \sum _{j=1}^{K}(-1)^{j-1}S_{j}\geq \mathbb {P} {\Big (}\bigcup _{i=1}^{n}A_{i}{\Big )}=\sum _{j=1}^{n}(-1)^{j-1}S_{j}}

se cumple, y cuando es par: K n {\displaystyle K\leq n}

j = 1 K ( 1 ) j 1 S j P ( i = 1 n A i ) = j = 1 n ( 1 ) j 1 S j {\displaystyle \sum _{j=1}^{K}(-1)^{j-1}S_{j}\leq \mathbb {P} {\Big (}\bigcup _{i=1}^{n}A_{i}{\Big )}=\sum _{j=1}^{n}(-1)^{j-1}S_{j}}

sostiene.

Las igualdades se derivan del principio de inclusión-exclusión , y la desigualdad de Boole es el caso especial de . K = 1 {\displaystyle K=1}

Prueba de K impar

Sea , donde para cada . Estas particiones del espacio muestral, y para cada uno y cada , están contenidas en él o son disjuntas de él. E = i = 1 n B i {\displaystyle E=\bigcap _{i=1}^{n}B_{i}} B i { A i , A i c } {\displaystyle B_{i}\in \{A_{i},A_{i}^{c}\}} i = 1 , , n {\displaystyle i=1,\dots ,n} E {\displaystyle E} E {\displaystyle E} i {\displaystyle i} E {\displaystyle E} A i {\displaystyle A_{i}}

Si , entonces contribuye 0 a ambos lados de la desigualdad. E = i = 1 n A i c {\displaystyle E=\bigcap _{i=1}^{n}A_{i}^{c}} E {\displaystyle E}

De lo contrario, supongamos que está contenido exactamente en . Entonces contribuye exactamente al lado derecho de la desigualdad, mientras que contribuye E {\displaystyle E} L {\displaystyle L} A i {\displaystyle A_{i}} E {\displaystyle E} P ( E ) {\displaystyle \mathbb {P} (E)}

j = 1 K ( 1 ) j 1 ( L j ) P ( E ) {\displaystyle \sum _{j=1}^{K}(-1)^{j-1}{L \choose j}\mathbb {P} (E)}

al lado izquierdo de la desigualdad. Sin embargo, por la regla de Pascal , esto es igual a

j = 1 K ( 1 ) j 1 ( ( L 1 j 1 ) + ( L 1 j ) ) P ( E ) {\displaystyle \sum _{j=1}^{K}(-1)^{j-1}{\Big (}{L-1 \choose j-1}+{L-1 \choose j}{\Big )}\mathbb {P} (E)}

¿Qué telescopios utilizar?

( 1 + ( L 1 K ) ) P ( E ) P ( E ) {\displaystyle {\Big (}1+{L-1 \choose K}{\Big )}\mathbb {P} (E)\geq \mathbb {P} (E)}

Por lo tanto, la desigualdad se cumple para todos los eventos y, al sumar sobre , obtenemos la desigualdad deseada: E {\displaystyle E} E {\displaystyle E}

j = 1 K ( 1 ) j 1 S j P ( i = 1 n A i ) {\displaystyle \sum _{j=1}^{K}(-1)^{j-1}S_{j}\geq \mathbb {P} {\Big (}\bigcup _{i=1}^{n}A_{i}{\Big )}}

La prueba para el caso par es casi idéntica. [3] K {\displaystyle K}

Ejemplo

Supongamos que está calculando cinco parámetros a partir de una muestra aleatoria y puede controlar cada parámetro por separado. Si desea que sus estimaciones de los cinco parámetros sean correctas con una probabilidad del 95 %, ¿qué debería hacer con cada parámetro?

Ajustar la probabilidad de que cada parámetro sea bueno dentro del 95 % no es suficiente porque "todos son buenos" es un subconjunto de cada evento "Estimación i es buena". Podemos usar la desigualdad de Boole para resolver este problema. Al encontrar el complemento del evento "los cinco son buenos", podemos convertir esta pregunta en otra condición:

P(al menos una estimación es mala) = 0,05 ≤ P(A 1 es mala) + P(A 2 es mala) + P(A 3 es mala) + P(A 4 es mala) + P(A 5 es mala)

Una forma de hacerlo es hacer que cada uno de ellos sea igual a 0,05/5 = 0,01, es decir, el 1 %. En otras palabras, hay que garantizar que cada estimación sea correcta en un 99 % (por ejemplo, construyendo un intervalo de confianza del 99 %) para asegurarse de que la estimación total sea correcta con una probabilidad del 95 %. Esto se denomina método de inferencia simultánea de Bonferroni.

Véase también

Referencias

  1. ^ Boole, George (1847). El análisis matemático de la lógica. Biblioteca filosófica. ISBN 9780802201546.
  2. ^ Casella, George; Berger, Roger L. (2002). Inferencia estadística. Duxbury. págs. 11-13. ISBN 0-534-24312-6.
  3. ^ Venkatesh, Santosh (2012). La teoría de la probabilidad. Cambridge University Press. pp. 94-99, 113-115. ISBN 978-0-534-24312-8.
  • Bonferroni, Carlo E. (1936), "Teoria statistica delle classi e calcolo delle probabilità", Pubbl. DR Ist. Súper. Di ciencia. Economía. E Commerciali di Firenze (en italiano), 8 : 1–62, Zbl  0016.41103
  • Dohmen, Klaus (2003), Inecuaciones de Bonferroni mejoradas mediante tubos abstractos. Inequalities and Identities of Inclusion–Exclusion Type , Lecture Notes in Mathematics, vol. 1826, Berlín: Springer-Verlag , pp. viii+113, ISBN 3-540-20025-8, MR  2019293, Zbl  1026.05009
  • Galambos, János ; Simonelli, Italo (1996), Desigualdades de tipo Bonferroni con aplicaciones , Probabilidad y sus aplicaciones, Nueva York: Springer-Verlag , pp. x+269, ISBN 0-387-94776-0, MR  1402242, Zbl  0869.60014
  • Galambos, János (1977), "Desigualdades de Bonferroni", Anales de probabilidad , 5 (4): 577–581, doi : 10.1214/aop/1176995765 , JSTOR  2243081, MR  0448478, Zbl  0369.60018
  • Galambos, János (2001) [1994], "Desigualdades de Bonferroni", Enciclopedia de Matemáticas , EMS Press

Este artículo incorpora material de Desigualdades de Bonferroni en PlanetMath , que se encuentra bajo la licencia Creative Commons Attribution/Share-Alike License .

Retrieved from "https://en.wikipedia.org/w/index.php?title=Boole%27s_inequality&oldid=1244809845"