Principio de inclusión-exclusión

Técnica de conteo en combinatoria
Diagrama de Venn que muestra la unión de los conjuntos A y B como todo lo que no está en blanco

En combinatoria , una rama de las matemáticas , el principio de inclusión-exclusión es una técnica de conteo que generaliza el método familiar de obtener el número de elementos en la unión de dos conjuntos finitos ; expresado simbólicamente como

| A B | = | A | + | B | | A B | {\displaystyle |A\cup B|=|A|+|B|-|A\cap B|}

donde A y B son dos conjuntos finitos y | S | indica la cardinalidad de un conjunto S (que puede considerarse como el número de elementos del conjunto, si el conjunto es finito ). La fórmula expresa el hecho de que la suma de los tamaños de los dos conjuntos puede ser demasiado grande, ya que algunos elementos pueden contarse dos veces. Los elementos contados dos veces son aquellos en la intersección de los dos conjuntos y el conteo se corrige restando el tamaño de la intersección.

El principio de inclusión-exclusión, al ser una generalización del caso de dos conjuntos, se ve quizás más claramente en el caso de tres conjuntos, que para los conjuntos A , B y C está dado por

| A B do | = | A | + | B | + | do | | A B | | A do | | B do | + | A B do | {\displaystyle |A\taza B\taza C|=|A|+|B|+|C|-|A\cap B|-|A\cap C|-|B\cap C|+|A\cap B\cap C|}

Esta fórmula se puede verificar contando cuántas veces se incluye cada región en la figura del diagrama de Venn en el lado derecho de la fórmula. En este caso, al eliminar las contribuciones de los elementos contados en exceso, la cantidad de elementos en la intersección mutua de los tres conjuntos se ha restado con demasiada frecuencia, por lo que se debe volver a sumar para obtener el total correcto.

Inclusión-exclusión ilustrada mediante un diagrama de Venn para tres conjuntos

Generalizando los resultados de estos ejemplos se obtiene el principio de inclusión-exclusión. Para hallar la cardinalidad de la unión de n conjuntos:

  1. Incluya las cardinalidades de los conjuntos.
  2. Excluir las cardinalidades de las intersecciones por pares.
  3. Incluya las cardinalidades de las intersecciones triples.
  4. Excluir las cardinalidades de las intersecciones cuádruples.
  5. Incluya las cardinalidades de las intersecciones quíntuples.
  6. Continuar hasta que se incluya (si n es impar) o excluya ( n es par) la cardinalidad de la intersección de n -tuplas .

El nombre proviene de la idea de que el principio se basa en una inclusión demasiado generosa , seguida de una exclusión compensatoria . Este concepto se atribuye a Abraham de Moivre (1718), [1] aunque aparece por primera vez en un artículo de Daniel da Silva (1854) [2] y más tarde en un artículo de JJ Sylvester (1883). [3] A veces se hace referencia al principio como la fórmula de Da Silva o Sylvester, debido a estas publicaciones. El principio puede verse como un ejemplo del método de tamiz ampliamente utilizado en la teoría de números y a veces se lo conoce como la fórmula de tamiz . [4]

Como las probabilidades finitas se calculan como recuentos relativos a la cardinalidad del espacio de probabilidad , las fórmulas para el principio de inclusión-exclusión siguen siendo válidas cuando las cardinalidades de los conjuntos se reemplazan por probabilidades finitas. En términos más generales, ambas versiones del principio pueden agruparse bajo el paraguas común de la teoría de la medida .

En un contexto muy abstracto, el principio de inclusión-exclusión puede expresarse como el cálculo de la inversa de una determinada matriz. [5] Esta inversa tiene una estructura especial, lo que hace que el principio sea una técnica extremadamente valiosa en combinatoria y áreas relacionadas de las matemáticas. Como lo expresó Gian-Carlo Rota : [6]

"Uno de los principios de enumeración más útiles en la teoría combinatoria y de probabilidad discreta es el célebre principio de inclusión-exclusión. Cuando se aplica con habilidad, este principio ha proporcionado la solución a muchos problemas combinatorios".

Fórmula

En su fórmula general, el principio de inclusión-exclusión establece que para conjuntos finitos A 1 , ..., A n , se tiene la identidad

| i = 1 norte A i | = i = 1 norte | A i | 1 i < yo norte | A i A yo | + 1 i < yo < a norte | A i A yo A a | + ( 1 ) norte + 1 | A 1 A norte | . {\displaystyle \left|\bigcup _{i=1}^{n}A_{i}\right|=\suma _{i=1}^{n}|A_{i}|-\suma _{1\leqslant i<j\leqslant n}|A_{i}\cap A_{j}|+\suma _{1\leqslant i<j<k\leqslant n}|A_{i}\cap A_{j}\cap A_{k}|-\cdots +(-1)^{n+1}\left|A_{1}\cap \cdots \cap A_{n}\right|.} ( 1 )
Cada término de la fórmula de inclusión-exclusión corrige gradualmente el recuento hasta que finalmente cada porción del diagrama de Venn se cuenta exactamente una vez.

Esto se puede escribir de forma compacta como

| i = 1 norte A i | = a = 1 norte ( 1 ) a + 1 ( 1 i 1 < < i a norte | A i 1 A i a | ) {\displaystyle \left|\bigcup _{i=1}^{n}A_{i}\right|=\sum _{k=1}^{n}(-1)^{k+1}\left(\sum _{1\leqslant i_{1}<\cdots <i_{k}\leqslant n}|A_{i_{1}}\cap \cdots \cap A_{i_{k}}|\right)}

o

| i = 1 n A i | = J { 1 , , n } ( 1 ) | J | + 1 | j J A j | . {\displaystyle \left|\bigcup _{i=1}^{n}A_{i}\right|=\sum _{\emptyset \neq J\subseteq \{1,\ldots ,n\}}(-1)^{|J|+1}\left|\bigcap _{j\in J}A_{j}\right|.}

En otras palabras, para contar el número de elementos en una unión finita de conjuntos finitos, primero se suman las cardinalidades de los conjuntos individuales, luego se resta el número de elementos que aparecen en al menos dos conjuntos, luego se vuelve a sumar el número de elementos que aparecen en al menos tres conjuntos, luego se resta el número de elementos que aparecen en al menos cuatro conjuntos, y así sucesivamente. Este proceso siempre termina, ya que no puede haber elementos que aparezcan en más de la cantidad de conjuntos en la unión. (Por ejemplo, si no puede haber elementos que aparezcan en más de conjuntos; equivalentemente, no puede haber elementos que aparezcan en al menos conjuntos). n = 4 , {\displaystyle n=4,} 4 {\displaystyle 4} 5 {\displaystyle 5}

En aplicaciones es común ver el principio expresado en su forma complementaria, es decir, siendo S un conjunto universal finito que contiene todos los A i y denotando el complemento de A i en S , por las leyes de De Morgan tenemos A i ¯ {\displaystyle {\bar {A_{i}}}}

| i = 1 n A i ¯ | = | S i = 1 n A i | = | S | i = 1 n | A i | + 1 i < j n | A i A j | + ( 1 ) n | A 1 A n | . {\displaystyle \left|\bigcap _{i=1}^{n}{\bar {A_{i}}}\right|=\left|S-\bigcup _{i=1}^{n}A_{i}\right|=|S|-\sum _{i=1}^{n}|A_{i}|+\sum _{1\leqslant i<j\leqslant n}|A_{i}\cap A_{j}|-\cdots +(-1)^{n}|A_{1}\cap \cdots \cap A_{n}|.}

Como otra variante del enunciado, sea P 1 , ..., P n una lista de propiedades que los elementos de un conjunto S pueden tener o no, entonces el principio de inclusión-exclusión proporciona una forma de calcular el número de elementos de S que no tienen ninguna de las propiedades. Simplemente sea A i el subconjunto de elementos de S que tienen la propiedad P i y use el principio en su forma complementaria. Esta variante se debe a JJ Sylvester . [1]

Tenga en cuenta que si solo tiene en cuenta las primeras m<n sumas de la derecha (en la forma general del principio), obtendrá una sobreestimación si m es impar y una subestimación si m es par.

Ejemplos

Trastornos del recuento

Un ejemplo más complejo es el siguiente.

Supongamos que hay una baraja de n cartas numeradas del 1 al  n . Supongamos que una carta numerada m está en la posición correcta si es la carta m de la baraja. ¿De cuántas maneras, W , se pueden barajar las cartas con al menos una carta en la posición correcta?

Comience por definir el conjunto A m , que son todos los ordenamientos de cartas con la carta m correcta. Entonces, el número de ordenamientos, W , con al menos una carta en la posición correcta, m , es

W = | m = 1 n A m | . {\displaystyle W=\left|\bigcup _{m=1}^{n}A_{m}\right|.}

Aplicar el principio de inclusión-exclusión,

W = m 1 = 1 n | A m 1 | 1 m 1 < m 2 n | A m 1 A m 2 | + + ( 1 ) p 1 1 m 1 < < m p n | A m 1 A m p | + {\displaystyle W=\sum _{m_{1}=1}^{n}|A_{m_{1}}|-\sum _{1\leqslant m_{1}<m_{2}\leqslant n}|A_{m_{1}}\cap A_{m_{2}}|+\cdots +(-1)^{p-1}\sum _{1\leqslant m_{1}<\cdots <m_{p}\leqslant n}|A_{m_{1}}\cap \cdots \cap A_{m_{p}}|+\cdots }

Cada valor representa el conjunto de barajas que tienen al menos valores p m 1 , ...,  m p en la posición correcta. Nótese que el número de barajas con al menos valores p correctos solo depende de p , no de los valores particulares de . Por ejemplo, el número de barajas que tienen las cartas 1. a , 3. a y 17. a en la posición correcta es el mismo que el número de barajas que tienen las cartas 2. a , 5. a y 13. a en las posiciones correctas. Solo importa que de las n cartas, 3 fueron elegidas para estar en la posición correcta. Por lo tanto, hay términos iguales en la suma p ésima (ver combinación ). A m 1 A m p {\displaystyle A_{m_{1}}\cap \cdots \cap A_{m_{p}}} m {\displaystyle m} ( n p ) {\textstyle {n \choose p}}

W = ( n 1 ) | A 1 | ( n 2 ) | A 1 A 2 | + + ( 1 ) p 1 ( n p ) | A 1 A p | + {\displaystyle W={n \choose 1}|A_{1}|-{n \choose 2}|A_{1}\cap A_{2}|+\cdots +(-1)^{p-1}{n \choose p}|A_{1}\cap \cdots \cap A_{p}|+\cdots }

| A 1 A p | {\displaystyle |A_{1}\cap \cdots \cap A_{p}|} es el número de ordenaciones que tienen p elementos en la posición correcta, que es igual al número de formas de ordenar los n  −  p elementos restantes, o ( n  −  p )!. Por lo tanto, finalmente obtenemos:

W = ( n 1 ) ( n 1 ) ! ( n 2 ) ( n 2 ) ! + + ( 1 ) p 1 ( n p ) ( n p ) ! + = p = 1 n ( 1 ) p 1 ( n p ) ( n p ) ! = p = 1 n ( 1 ) p 1 n ! p ! ( n p ) ! ( n p ) ! = p = 1 n ( 1 ) p 1 n ! p ! {\displaystyle {\begin{aligned}W&={n \choose 1}(n-1)!-{n \choose 2}(n-2)!+\cdots +(-1)^{p-1}{n \choose p}(n-p)!+\cdots \\&=\sum _{p=1}^{n}(-1)^{p-1}{n \choose p}(n-p)!\\&=\sum _{p=1}^{n}(-1)^{p-1}{\frac {n!}{p!(n-p)!}}(n-p)!\\&=\sum _{p=1}^{n}(-1)^{p-1}{\frac {n!}{p!}}\end{aligned}}}

Una permutación en la que ninguna carta está en la posición correcta se denomina desorden . Si tomamos n ! como el número total de permutaciones, la probabilidad Q de que una mezcla aleatoria produzca un desorden viene dada por

Q = 1 W n ! = p = 0 n ( 1 ) p p ! , {\displaystyle Q=1-{\frac {W}{n!}}=\sum _{p=0}^{n}{\frac {(-1)^{p}}{p!}},}

un truncamiento a n  + 1 términos de la expansión de Taylor de e −1 . Por lo tanto, la probabilidad de adivinar el orden de una baraja de cartas barajada y equivocarse con respecto a cada carta es aproximadamente e −1 o 37%.

Un caso especial

La situación que aparece en el ejemplo de desarreglo anterior ocurre con la suficiente frecuencia como para merecer una atención especial. [7] Es decir, cuando el tamaño de los conjuntos de intersección que aparecen en las fórmulas para el principio de inclusión-exclusión depende sólo del número de conjuntos en las intersecciones y no de qué conjuntos aparecen. Más formalmente, si la intersección

A J := j J A j {\displaystyle A_{J}:=\bigcap _{j\in J}A_{j}}

tiene la misma cardinalidad, digamos α k = | A J |, para cada subconjunto de k elementos J de {1, ...,  n }, entonces

| i = 1 n A i | = k = 1 n ( 1 ) k 1 ( n k ) α k . {\displaystyle \left|\bigcup _{i=1}^{n}A_{i}\right|=\sum _{k=1}^{n}(-1)^{k-1}{\binom {n}{k}}\alpha _{k}.}

O, en la forma complementaria, donde el conjunto universal S tiene cardinalidad α 0 ,

| S i = 1 n A i | = α 0 k = 0 n ( 1 ) k 1 ( n k ) α k . {\displaystyle \left|S\smallsetminus \bigcup _{i=1}^{n}A_{i}\right|=\alpha _{0}-\sum _{k=0}^{n}(-1)^{k-1}{\binom {n}{k}}\alpha _{k}.}

Generalización de fórmulas

Dada una familia (se permiten repeticiones) de subconjuntos A 1 , A 2 , ..., A n de un conjunto universal S , el principio de inclusión-exclusión calcula el número de elementos de S que no hay en ninguno de estos subconjuntos. Una generalización de este concepto calcularía el número de elementos de S que aparecen exactamente en algún m fijo de estos conjuntos.

Sea N = [ n ] = {1,2,..., n }. Si definimos , entonces el principio de inclusión-exclusión puede escribirse como, utilizando la notación de la sección anterior; el número de elementos de S contenidos en ninguno de los A i es: A = S {\displaystyle A_{\emptyset }=S}

J [ n ] ( 1 ) | J | | A J | . {\displaystyle \sum _{J\subseteq [n]}(-1)^{|J|}|A_{J}|.}

Si I es un subconjunto fijo del conjunto de índices N , entonces el número de elementos que pertenecen a A i para todos los i en I y para ningún otro valor es: [8]

I J ( 1 ) | J | | I | | A J | . {\displaystyle \sum _{I\subseteq J}(-1)^{|J|-|I|}|A_{J}|.}

Definir los conjuntos

B k = A I { k }  for  k N I . {\displaystyle B_{k}=A_{I\cup \{k\}}{\text{ for }}k\in N\smallsetminus I.}

Buscamos el número de elementos en ninguno de los B k que, por el principio de inclusión-exclusión (con ), es B = A I {\displaystyle B_{\emptyset }=A_{I}}

K N I ( 1 ) | K | | B K | . {\displaystyle \sum _{K\subseteq N\smallsetminus I}(-1)^{|K|}|B_{K}|.}

La correspondencia KJ = IK entre subconjuntos de N  \  I y subconjuntos de N que contienen a I es una biyección y si J y K corresponden bajo esta función entonces B K = A J , lo que demuestra que el resultado es válido.

En probabilidad

En probabilidad , para los eventos A 1 , ..., A n en un espacio de probabilidad , el principio de inclusión-exclusión se convierte en para n  = 2 ( Ω , F , P ) {\displaystyle (\Omega ,{\mathcal {F}},\mathbb {P} )}

P ( A 1 A 2 ) = P ( A 1 ) + P ( A 2 ) P ( A 1 A 2 ) , {\displaystyle \mathbb {P} (A_{1}\cup A_{2})=\mathbb {P} (A_{1})+\mathbb {P} (A_{2})-\mathbb {P} (A_{1}\cap A_{2}),}

para n  = 3

P ( A 1 A 2 A 3 ) = P ( A 1 ) + P ( A 2 ) + P ( A 3 ) P ( A 1 A 2 ) P ( A 1 A 3 ) P ( A 2 A 3 ) + P ( A 1 A 2 A 3 ) {\displaystyle \mathbb {P} (A_{1}\cup A_{2}\cup A_{3})=\mathbb {P} (A_{1})+\mathbb {P} (A_{2})+\mathbb {P} (A_{3})-\mathbb {P} (A_{1}\cap A_{2})-\mathbb {P} (A_{1}\cap A_{3})-\mathbb {P} (A_{2}\cap A_{3})+\mathbb {P} (A_{1}\cap A_{2}\cap A_{3})}

y en general

P ( i = 1 n A i ) = i = 1 n P ( A i ) i < j P ( A i A j ) + i < j < k P ( A i A j A k ) + + ( 1 ) n 1 i < . . . < n P ( i = 1 n A i ) , {\displaystyle \mathbb {P} \left(\bigcup _{i=1}^{n}A_{i}\right)=\sum _{i=1}^{n}\mathbb {P} (A_{i})-\sum _{i<j}\mathbb {P} (A_{i}\cap A_{j})+\sum _{i<j<k}\mathbb {P} (A_{i}\cap A_{j}\cap A_{k})+\cdots +(-1)^{n-1}\sum _{i<...<n}\mathbb {P} \left(\bigcap _{i=1}^{n}A_{i}\right),}

que puede escribirse en forma cerrada como

P ( i = 1 n A i ) = k = 1 n ( ( 1 ) k 1 I { 1 , , n } | I | = k P ( A I ) ) , {\displaystyle \mathbb {P} \left(\bigcup _{i=1}^{n}A_{i}\right)=\sum _{k=1}^{n}\left((-1)^{k-1}\sum _{I\subseteq \{1,\ldots ,n\} \atop |I|=k}\mathbb {P} (A_{I})\right),}

donde la última suma recorre todos los subconjuntos I de los índices 1, ..., n que contienen exactamente k elementos, y

A I := i I A i {\displaystyle A_{I}:=\bigcap _{i\in I}A_{i}}

denota la intersección de todos aquellos A i con índice en I .

Según las desigualdades de Bonferroni , la suma de los primeros términos de la fórmula es alternativamente un límite superior y un límite inferior para el lado izquierdo . Esto se puede utilizar en casos en los que la fórmula completa es demasiado complicada.

Para un espacio de medida general ( S ,Σ, μ ) y subconjuntos mensurables A 1 , ..., A n de medida finita, las identidades anteriores también se cumplen cuando la medida de probabilidad se reemplaza por la medida μ . P {\displaystyle \mathbb {P} }

Caso especial

Si, en la versión probabilística del principio de inclusión-exclusión, la probabilidad de la intersección A I sólo depende de la cardinalidad de I , lo que significa que para cada k en {1, ...,  n } hay un a k tal que

a k = P ( A I )  for every  I { 1 , , n }  with  | I | = k , {\displaystyle a_{k}=\mathbb {P} (A_{I}){\text{ for every }}I\subset \{1,\ldots ,n\}{\text{ with }}|I|=k,}

Entonces la fórmula anterior se simplifica a

P ( i = 1 n A i ) = k = 1 n ( 1 ) k 1 ( n k ) a k {\displaystyle \mathbb {P} \left(\bigcup _{i=1}^{n}A_{i}\right)=\sum _{k=1}^{n}(-1)^{k-1}{\binom {n}{k}}a_{k}}

debido a la interpretación combinatoria del coeficiente binomial . Por ejemplo, si los eventos son independientes y están distribuidos de manera idéntica , entonces para todo i , y tenemos , en cuyo caso la expresión anterior se simplifica a ( n k ) {\textstyle {\binom {n}{k}}} A i {\displaystyle A_{i}} P ( A i ) = p {\displaystyle \mathbb {P} (A_{i})=p} a k = p k {\displaystyle a_{k}=p^{k}}

P ( i = 1 n A i ) = 1 ( 1 p ) n . {\displaystyle \mathbb {P} \left(\bigcup _{i=1}^{n}A_{i}\right)=1-(1-p)^{n}.}

(Este resultado también puede derivarse de forma más sencilla considerando la intersección de los complementos de los eventos ). A i {\displaystyle A_{i}}

Una simplificación análoga es posible en el caso de un espacio de medida general y subconjuntos mensurables de medida finita. ( S , Σ , μ ) {\displaystyle (S,\Sigma ,\mu )} A 1 , , A n {\displaystyle A_{1},\dots ,A_{n}}

Hay otra fórmula que se utiliza en los procesos puntuales . Sea un conjunto finito y un subconjunto aleatorio de . Sea cualquier subconjunto de , entonces S {\displaystyle S} P {\displaystyle P} S {\displaystyle S} A {\displaystyle A} S {\displaystyle S}

P ( P = A ) = P ( P A ) j 1 S A P ( P A j 1 ) + j 1 , j 2 S A   j 1 j 2 P ( P A j 1 , j 2 ) + + ( 1 ) | S | | A | P ( P S ) = A J S ( 1 ) | J | | A | P ( P J ) . {\displaystyle {\begin{aligned}\mathbb {P} (P=A)&=\mathbb {P} (P\supset A)-\sum _{j_{1}\in S\setminus A}\mathbb {P} (P\supset A\cup {j_{1}})\\&+\sum _{j_{1},j_{2}\in S\setminus A\ j_{1}\neq j_{2}}\mathbb {P} (P\supset A\cup {j_{1},j_{2}})+\dots \\&+(-1)^{|S|-|A|}\mathbb {P} (P\supset S)\\&=\sum _{A\subset J\subset S}(-1)^{|J|-|A|}\mathbb {P} (P\supset J).\end{aligned}}}

Otras fórmulas

El principio a veces se enuncia en la forma [9] que dice que si

g ( A ) = S A f ( S ) {\displaystyle g(A)=\sum _{S\subseteq A}f(S)}

entonces

f ( A ) = S A ( 1 ) | A | | S | g ( S ) {\displaystyle f(A)=\sum _{S\subseteq A}(-1)^{|A|-|S|}g(S)} ( 2 )

La versión combinatoria y probabilística del principio de inclusión-exclusión son instancias de ( 2 ).

Prueba

Toma , , y m _ = { 1 , 2 , , m } {\displaystyle {\underline {m}}=\{1,2,\ldots ,m\}} f ( m _ ) = 0 {\displaystyle f({\underline {m}})=0}

f ( S ) = | i m _ S A i i S A i |  and  f ( S ) = P ( i m _ S A i i S A i ) {\displaystyle f(S)=\left|\bigcap _{i\in {\underline {m}}\smallsetminus S}A_{i}\smallsetminus \bigcup _{i\in S}A_{i}\right|{\text{ and }}f(S)=\mathbb {P} \left(\bigcap _{i\in {\underline {m}}\smallsetminus S}A_{i}\smallsetminus \bigcup _{i\in S}A_{i}\right)}

respectivamente para todos los conjuntos con . Entonces obtenemos S {\displaystyle S} S m _ {\displaystyle S\subsetneq {\underline {m}}}

g ( A ) = | i m _ A A i | , g ( m _ ) = | i m _ A i |  and  g ( A ) = P ( i m _ A A i ) ,     g ( m _ ) = P ( i m _ A i ) {\displaystyle g(A)=\left|\bigcap _{i\in {\underline {m}}\smallsetminus A}A_{i}\right|,\quad g({\underline {m}})=\left|\bigcup _{i\in {\underline {m}}}A_{i}\right|{\text{ and }}g(A)=\mathbb {P} \left(\bigcap _{i\in {\underline {m}}\smallsetminus A}A_{i}\right),~~g({\underline {m}})=\mathbb {P} \left(\bigcup _{i\in {\underline {m}}}A_{i}\right)}

respectivamente para todos los conjuntos con . Esto se debe a que los elementos de pueden estar contenidos en otros ( con ) también, y la fórmula se ejecuta exactamente a través de todas las extensiones posibles de los conjuntos con otros , contando solo para el conjunto que coincide con el comportamiento de pertenencia de , si se ejecuta a través de todos los subconjuntos de (como en la definición de ). A {\displaystyle A} A m _ {\displaystyle A\subsetneq {\underline {m}}} a {\displaystyle a} i m _ A A i {\displaystyle \cap _{i\in {\underline {m}}\smallsetminus A}A_{i}} A i {\displaystyle A_{i}} A i {\displaystyle A_{i}} i A {\displaystyle i\in A} {\displaystyle \cap \smallsetminus \cup } { A i i m _ A } {\displaystyle \{A_{i}\mid i\in {\underline {m}}\smallsetminus A\}} A i {\displaystyle A_{i}} a {\displaystyle a} a {\displaystyle a} S {\displaystyle S} A {\displaystyle A} g ( A ) {\displaystyle g(A)}

Como , obtenemos de ( 2 ) con que f ( m _ ) = 0 {\displaystyle f({\underline {m}})=0} A = m _ {\displaystyle A={\underline {m}}}

m _ T ( 1 ) | T | 1 g ( m _ T ) = S m _ ( 1 ) m | S | 1 g ( S ) = g ( m _ ) {\displaystyle \sum _{{\underline {m}}\supseteq T\supsetneq \varnothing }(-1)^{|T|-1}g({\underline {m}}\smallsetminus T)=\sum _{\varnothing \subseteq S\subsetneq {\underline {m}}}(-1)^{m-|S|-1}g(S)=g({\underline {m}})}

y al intercambiar los lados, se obtienen la versión combinatoria y probabilística del principio de inclusión-exclusión.

Si se considera un número como un conjunto de sus factores primos, entonces ( 2 ) es una generalización de la fórmula de inversión de Möbius para números naturales sin cuadrados . Por lo tanto, ( 2 ) se considera como la fórmula de inversión de Möbius para el álgebra de incidencia del conjunto parcialmente ordenado de todos los subconjuntos de A. n {\displaystyle n}

Para generalizar la versión completa de la fórmula de inversión de Möbius, ( 2 ) debe generalizarse a multiconjuntos . Para multiconjuntos en lugar de conjuntos, ( 2 ) se convierte en

f ( A ) = S A μ ( A S ) g ( S ) {\displaystyle f(A)=\sum _{S\subseteq A}\mu (A-S)g(S)} ( 3 )

¿Dónde está el multiconjunto para el cual , y A S {\displaystyle A-S} ( A S ) S = A {\displaystyle (A-S)\uplus S=A}

  • μ ( S ) = 1 si S es un conjunto (es decir, un multiconjunto sin elementos dobles) de cardinalidad par .
  • μ ( S ) = −1 si S es un conjunto (es decir, un multiconjunto sin elementos dobles) de cardinalidad impar.
  • μ ( S ) = 0 si S es un multiconjunto propio (es decir, S tiene elementos dobles).

Tenga en cuenta que es solo el de ( 2 ) en el caso de que sea un conjunto. μ ( A S ) {\displaystyle \mu (A-S)} ( 1 ) | A | | S | {\displaystyle (-1)^{|A|-|S|}} A S {\displaystyle A-S}

Prueba de ( 3 )

Sustituya en el lado derecho de ( 3 ). Observe que aparece una vez en ambos lados de ( 3 ). Por lo tanto, debemos demostrar que para todos con , los términos se cancelan en el lado derecho de ( 3 ). Para ese propósito, tome un fijo tal que y tome un fijo arbitrario tal que . g ( S ) = T S f ( T ) {\displaystyle g(S)=\sum _{T\subseteq S}f(T)} f ( A ) {\displaystyle f(A)} T {\displaystyle T} T A {\displaystyle T\subsetneq A} f ( T ) {\displaystyle f(T)} T {\displaystyle T} T A {\displaystyle T\subsetneq A} a A {\displaystyle a\in A} a T {\displaystyle a\notin T}

Nótese que debe ser un conjunto para cada aparición positiva o negativa de en el lado derecho de ( 3 ) que se obtiene por medio del multiconjunto tal que . Ahora, cada aparición de en el lado derecho de ( 3 ) que se obtiene por medio de tal que es un conjunto que contiene se cancela con la que se obtiene por medio del correspondiente tal que es un conjunto que no contiene . Esto da el resultado deseado. A S {\displaystyle A-S} f ( T ) {\displaystyle f(T)} S {\displaystyle S} T S A {\displaystyle T\subseteq S\subseteq A} f ( T ) {\displaystyle f(T)} S {\displaystyle S} A S {\displaystyle A-S} a {\displaystyle a} S {\displaystyle S} A S {\displaystyle A-S} a {\displaystyle a}

Aplicaciones

El principio de inclusión-exclusión se utiliza ampliamente y aquí sólo se pueden mencionar algunas de sus aplicaciones.

Trastornos del recuento

Una aplicación bien conocida del principio de inclusión-exclusión es el problema combinatorio de contar todos los desajustes de un conjunto finito. Un desajuste de un conjunto A es una biyección de A en sí mismo que no tiene puntos fijos. Mediante el principio de inclusión-exclusión se puede demostrar que si la cardinalidad de A es n , entonces el número de desajustes es [ n ! /  e ] donde [ x ] denota el entero más cercano a x ; una demostración detallada está disponible aquí y también véase la sección de ejemplos anterior.

La primera aparición del problema de contar el número de trastornos se encuentra en un libro temprano sobre juegos de azar: Essai d'analyse sur les jeux de hazard de PR de Montmort (1678-1719) y se conocía como "el problema de Montmort" o por el nombre que él le dio, " problema de los encuentros ". [10] El problema también se conoce como el problema del guardarropa.

El número de desajustes también se conoce como el subfactorial de n , escrito ! n . De ello se deduce que si a todas las biyecciones se les asigna la misma probabilidad, entonces la probabilidad de que una biyección aleatoria sea un desajuste se acerca rápidamente a 1/ e a medida que n crece.

Contando intersecciones

El principio de inclusión-exclusión, combinado con la ley de De Morgan , también se puede utilizar para contar la cardinalidad de la intersección de conjuntos. Sea el complemento de A k con respecto a algún conjunto universal A tal que para cada k . Entonces tenemos A k ¯ {\displaystyle {\overline {A_{k}}}} A k A {\displaystyle A_{k}\subseteq A}

i = 1 n A i = i = 1 n A i ¯ ¯ {\displaystyle \bigcap _{i=1}^{n}A_{i}={\overline {\bigcup _{i=1}^{n}{\overline {A_{i}}}}}}

convirtiendo así el problema de encontrar una intersección en el problema de encontrar una unión.

Coloración de gráficos

El principio de inclusión y exclusión constituye la base de algoritmos para una serie de problemas de partición de gráficos NP-hard, como la coloración de gráficos. [11]

Una aplicación bien conocida del principio es la construcción del polinomio cromático de un gráfico. [12]

Correspondencias perfectas de gráficos bipartitos

El número de emparejamientos perfectos de un gráfico bipartito se puede calcular utilizando el principio. [13]

Número de funciones onto

Dados los conjuntos finitos A y B , ¿cuántas funciones sobreyectivas (funciones sobre) hay de A a B ? Sin ninguna pérdida de generalidad podemos tomar A = {1, ..., k } y B = {1, ..., n }, ya que sólo importan las cardinalidades de los conjuntos. Al usar S como el conjunto de todas las funciones de A a B , y definir, para cada i en B , la propiedad P i como "la función omite el elemento i en B " ( i no está en la imagen de la función), el principio de inclusión-exclusión da el número de funciones sobreyectivas entre A y B como: [14]

j = 0 n ( n j ) ( 1 ) j ( n j ) k . {\displaystyle \sum _{j=0}^{n}{\binom {n}{j}}(-1)^{j}(n-j)^{k}.}

Permutaciones con posiciones prohibidas

Una permutación del conjunto S = {1, ..., n } donde cada elemento de S está restringido a no estar en ciertas posiciones (aquí la permutación se considera como un ordenamiento de los elementos de S ) se denomina permutación con posiciones prohibidas . Por ejemplo, con S = {1,2,3,4}, las permutaciones con la restricción de que el elemento 1 no puede estar en las posiciones 1 o 3, y el elemento 2 no puede estar en la posición 4 son: 2134, 2143, 3124, 4123, 2341, 2431, 3241, 3421, 4231 y 4321. Al dejar que A i sea el conjunto de posiciones en las que no se permite que esté el elemento i , y la propiedad P i sea la propiedad de que una permutación pone al elemento i en una posición en A i , se puede utilizar el principio de inclusión-exclusión para contar el número de permutaciones que satisfacen todas las restricciones. [15]

En el ejemplo dado, hay 12 = 2(3!) permutaciones con la propiedad P 1 , 6 = 3! permutaciones con la propiedad P 2 y ninguna permutación tiene las propiedades P 3 o P 4 ya que no hay restricciones para estos dos elementos. El número de permutaciones que satisfacen las restricciones es, por lo tanto:

4! − (12 + 6 + 0 + 0) + (4) = 24 − 18 + 4 = 10.

Los 4 últimos de este cálculo son el número de permutaciones que tienen ambas propiedades P 1 y P 2 . No hay otras contribuciones distintas de cero a la fórmula.

Números de Stirling del segundo tipo

Los números de Stirling de segunda especie , S ( n , k ) cuentan el número de particiones de un conjunto de n elementos en k subconjuntos no vacíos ( cajas indistinguibles ). Se puede obtener una fórmula explícita para ellos aplicando el principio de inclusión-exclusión a un problema muy relacionado, es decir, contar el número de particiones de un conjunto n en k cajas no vacías pero distinguibles ( subconjuntos ordenados no vacíos). Utilizando el conjunto universal que consiste en todas las particiones del conjunto n en k cajas distinguibles (posiblemente vacías), A 1 , A 2 , ..., A k , y las propiedades P i que significan que la partición tiene la caja A i vacía, el principio de inclusión-exclusión da una respuesta para el resultado relacionado. Dividiendo por k ! para eliminar el ordenamiento artificial se obtiene el número de Stirling de segunda especie: [16]

S ( n , k ) = 1 k ! t = 0 k ( 1 ) t ( k t ) ( k t ) n . {\displaystyle S(n,k)={\frac {1}{k!}}\sum _{t=0}^{k}(-1)^{t}{\binom {k}{t}}(k-t)^{n}.}

Polinomios de torre

Un polinomio de torre es la función generadora del número de formas de colocar torres no atacantes en un tablero B que parece un subconjunto de los cuadrados de un tablero de ajedrez ; es decir, no puede haber dos torres en la misma fila o columna. El tablero B es cualquier subconjunto de los cuadrados de un tablero rectangular con n filas y m columnas; lo consideramos como los cuadrados en los que se permite colocar una torre. El coeficiente , r k ( B ) de x k en el polinomio de torre R B ( x ) es el número de formas en que k torres, ninguna de las cuales ataca a otra, se pueden organizar en los cuadrados de B . Para cualquier tablero B , hay un tablero complementario que consiste en los cuadrados del tablero rectangular que no están en B . Este tablero complementario también tiene un polinomio de torre con coeficientes B {\displaystyle B'} R B ( x ) {\displaystyle R_{B'}(x)} r k ( B ) . {\displaystyle r_{k}(B').}

A veces resulta conveniente poder calcular el coeficiente más alto de un polinomio de torre en términos de los coeficientes del polinomio de torre del tablero complementario. Sin pérdida de generalidad, podemos suponer que nm , por lo que este coeficiente es r n ( B ). El número de formas de colocar n torres no atacantes en el "tablero de ajedrez" completo de n × m (sin tener en cuenta si las torres están colocadas en las casillas del tablero B ) viene dado por el factorial descendente :

( m ) n = m ( m 1 ) ( m 2 ) ( m n + 1 ) . {\displaystyle (m)_{n}=m(m-1)(m-2)\cdots (m-n+1).}

Sea P i la propiedad de que una asignación de n torres no atacantes en el tablero completo tiene una torre en la columna i que no está en un cuadrado del tablero B , entonces por el principio de inclusión-exclusión tenemos: [17]

r n ( B ) = t = 0 n ( 1 ) t ( m t ) n t r t ( B ) . {\displaystyle r_{n}(B)=\sum _{t=0}^{n}(-1)^{t}(m-t)_{n-t}r_{t}(B').}

Función phi de Euler

La función totiente o phi de Euler, φ ( n ), es una función aritmética que cuenta el número de números enteros positivos menores o iguales a n que son primos entre sí con n . Es decir, si n es un número entero positivo , entonces φ( n ) es el número de números enteros k en el rango 1 ≤ kn que no tienen ningún factor común con n distinto de 1. El principio de inclusión-exclusión se utiliza para obtener una fórmula para φ( n ). Sea S el conjunto {1, ..., n } y definamos la propiedad P i como que un número en S es divisible por el número primo p i , para 1 ≤ ir , donde la factorización prima de

n = p 1 a 1 p 2 a 2 p r a r . {\displaystyle n=p_{1}^{a_{1}}p_{2}^{a_{2}}\cdots p_{r}^{a_{r}}.}

Entonces, [18]

φ ( n ) = n i = 1 r n p i + 1 i < j r n p i p j = n i = 1 r ( 1 1 p i ) . {\displaystyle \varphi (n)=n-\sum _{i=1}^{r}{\frac {n}{p_{i}}}+\sum _{1\leqslant i<j\leqslant r}{\frac {n}{p_{i}p_{j}}}-\cdots =n\prod _{i=1}^{r}\left(1-{\frac {1}{p_{i}}}\right).}

Método de la hipérbola de Dirichlet

Un ejemplo del método de hipérbola de Dirichlet con y n = 10 , {\displaystyle n=10,} a 2.7 , {\displaystyle a\approx 2.7,} b 3.7. {\displaystyle b\approx 3.7.}

El método de la hipérbola de Dirichlet reexpresa una suma de una función multiplicativa seleccionando una convolución de Dirichlet adecuada , reconociendo que la suma f ( n ) {\displaystyle f(n)} f = g h {\displaystyle f=g\ast h}

F ( n ) = k = 1 n f ( k ) = k = 1 n x y = k g ( x ) h ( y ) {\displaystyle F(n)=\sum _{k=1}^{n}f(k)=\sum _{k=1}^{n}\sum _{xy=k}^{}g(x)h(y)}

se puede reformular como una suma sobre los puntos de la red en una región delimitada por , , y , dividiendo esta región en dos subregiones superpuestas y, finalmente, utilizando el principio de inclusión-exclusión para concluir que x 1 {\displaystyle x\geq 1} y 1 {\displaystyle y\geq 1} x y n {\displaystyle xy\leq n}

F ( n ) = k = 1 n f ( k ) = k = 1 n x y = k g ( x ) h ( y ) = x = 1 a y = 1 n / x g ( x ) h ( y ) + y = 1 b x = 1 n / y g ( x ) h ( y ) x = 1 a y = 1 b g ( x ) h ( y ) . {\displaystyle F(n)=\sum _{k=1}^{n}f(k)=\sum _{k=1}^{n}\sum _{xy=k}^{}g(x)h(y)=\sum _{x=1}^{a}\sum _{y=1}^{n/x}g(x)h(y)+\sum _{y=1}^{b}\sum _{x=1}^{n/y}g(x)h(y)-\sum _{x=1}^{a}\sum _{y=1}^{b}g(x)h(y).}

Principio de inclusión-exclusión diluido

En muchos casos en los que el principio podría dar una fórmula exacta (en particular, contar números primos utilizando la criba de Eratóstenes ), la fórmula resultante no ofrece un contenido útil porque el número de términos que contiene es excesivo. Si cada término individualmente puede estimarse con precisión, la acumulación de errores puede implicar que la fórmula de inclusión-exclusión no sea directamente aplicable. En teoría de números , esta dificultad fue abordada por Viggo Brun . Después de un comienzo lento, sus ideas fueron retomadas por otros y se desarrolló una gran variedad de métodos de criba . Estos, por ejemplo, pueden intentar encontrar límites superiores para los conjuntos "cribados", en lugar de una fórmula exacta.

Sean A 1 , ..., A n conjuntos arbitrarios y p 1 , ..., p n números reales en el intervalo unitario cerrado [0, 1] . Entonces, para cada número par k en {0, ..., n }, las funciones indicadoras satisfacen la desigualdad: [19]

1 A 1 A n j = 1 k ( 1 ) j 1 1 i 1 < < i j n p i 1 p i j 1 A i 1 A i j . {\displaystyle 1_{A_{1}\cup \cdots \cup A_{n}}\geq \sum _{j=1}^{k}(-1)^{j-1}\sum _{1\leq i_{1}<\cdots <i_{j}\leq n}p_{i_{1}}\dots p_{i_{j}}\,1_{A_{i_{1}}\cap \cdots \cap A_{i_{j}}}.}

Prueba de la afirmación principal

Elija un elemento contenido en la unión de todos los conjuntos y sea los conjuntos individuales que lo contienen. (Observe que t > 0.) Dado que el elemento se cuenta precisamente una vez por el lado izquierdo de la ecuación ( 1 ), necesitamos demostrar que se cuenta precisamente una vez por el lado derecho. En el lado derecho, las únicas contribuciones distintas de cero ocurren cuando todos los subconjuntos en un término particular contienen el elemento elegido, es decir, todos los subconjuntos se seleccionan de . La contribución es una para cada uno de estos conjuntos (más o menos dependiendo del término) y, por lo tanto, es solo el número (con signo) de estos subconjuntos utilizados en el término. Entonces tenemos: A 1 , A 2 , , A t {\displaystyle A_{1},A_{2},\dots ,A_{t}} A 1 , A 2 , , A t {\displaystyle A_{1},A_{2},\dots ,A_{t}}

| { A i 1 i t } | | { A i A j 1 i < j t } | + + ( 1 ) t + 1 | { A 1 A 2 A t } | = ( t 1 ) ( t 2 ) + + ( 1 ) t + 1 ( t t ) . {\displaystyle {\begin{aligned}|\{A_{i}\mid 1\leqslant i\leqslant t\}|&-|\{A_{i}\cap A_{j}\mid 1\leqslant i<j\leqslant t\}|+\cdots +(-1)^{t+1}|\{A_{1}\cap A_{2}\cap \cdots \cap A_{t}\}|={\binom {t}{1}}-{\binom {t}{2}}+\cdots +(-1)^{t+1}{\binom {t}{t}}.\end{aligned}}}

Por el teorema del binomio ,

0 = ( 1 1 ) t = ( t 0 ) ( t 1 ) + ( t 2 ) + ( 1 ) t ( t t ) . {\displaystyle 0=(1-1)^{t}={\binom {t}{0}}-{\binom {t}{1}}+{\binom {t}{2}}-\cdots +(-1)^{t}{\binom {t}{t}}.}

Usando el hecho de que y reordenando los términos, tenemos ( t 0 ) = 1 {\displaystyle {\binom {t}{0}}=1}

1 = ( t 1 ) ( t 2 ) + + ( 1 ) t + 1 ( t t ) , {\displaystyle 1={\binom {t}{1}}-{\binom {t}{2}}+\cdots +(-1)^{t+1}{\binom {t}{t}},}

y así, el elemento elegido se cuenta sólo una vez en el lado derecho de la ecuación ( 1 ).

Prueba algebraica

Se puede obtener una demostración algebraica utilizando funciones indicadoras (también conocidas como funciones características). La función indicadora de un subconjunto S de un conjunto X es la función

1 S : X { 0 , 1 } 1 S ( x ) = { 1 x S 0 x S {\displaystyle {\begin{aligned}&\mathbf {1} _{S}:X\to \{0,1\}\\&\mathbf {1} _{S}(x)={\begin{cases}1&x\in S\\0&x\notin S\end{cases}}\end{aligned}}}

Si y son dos subconjuntos de , entonces A {\displaystyle A} B {\displaystyle B} X {\displaystyle X}

1 A 1 B = 1 A B . {\displaystyle \mathbf {1} _{A}\cdot \mathbf {1} _{B}=\mathbf {1} _{A\cap B}.}

Sea A la unión de los conjuntos A 1 , ..., A n . Para demostrar el principio de inclusión-exclusión en general, primero verificamos la identidad i = 1 n A i {\textstyle \bigcup _{i=1}^{n}A_{i}}

1 A = k = 1 n ( 1 ) k 1 I { 1 , , n } | I | = k 1 A I {\displaystyle \mathbf {1} _{A}=\sum _{k=1}^{n}(-1)^{k-1}\sum _{I\subset \{1,\ldots ,n\} \atop |I|=k}\mathbf {1} _{A_{I}}} ( 4 )

para funciones indicadoras, donde:

A I = i I A i . {\displaystyle A_{I}=\bigcap _{i\in I}A_{i}.}

La siguiente función

( 1 A 1 A 1 ) ( 1 A 1 A 2 ) ( 1 A 1 A n ) = 0 , {\displaystyle \left(\mathbf {1} _{A}-\mathbf {1} _{A_{1}}\right)\left(\mathbf {1} _{A}-\mathbf {1} _{A_{2}}\right)\cdots \left(\mathbf {1} _{A}-\mathbf {1} _{A_{n}}\right)=0,}

es idénticamente cero porque: si x no está en A , entonces todos los factores son 0−0 = 0; y de lo contrario, si x pertenece a algún A m , entonces el factor m ésimo correspondiente es 1−1=0. Al desarrollar el producto en el lado izquierdo, se obtiene la ecuación ( 4 ).

Para demostrar el principio de inclusión-exclusión para la cardinalidad de conjuntos, sume la ecuación ( 4 ) sobre todos los x en la unión de A 1 , ..., A n . Para derivar la versión utilizada en probabilidad, tome la esperanza en ( 4 ). En general, integre la ecuación ( 4 ) con respecto a  μ . Utilice siempre la linealidad en estas derivaciones.

Véase también

Notas

  1. ^ ab Roberts y Tesman 2009, pág. 405
  2. ^ Mazur 2010, pág. 94
  3. ^ van Lint y Wilson 1992, pág. 77
  4. ^ van Lint y Wilson 1992, pág. 77
  5. ^ Stanley 1986, pág. 64
  6. ^ Rota, Gian-Carlo (1964), "Sobre los fundamentos de la teoría combinatoria I. Teoría de las funciones de Möbius", Zeitschrift für Wahrscheinlichkeitstheorie und Verwandte Gebiete , 2 (4): 340–368, doi : 10.1007/BF00531932 , S2CID  121334025
  7. ^ Brualdi 2010, págs. 167-8
  8. ^ Cameron 1994, pág. 78
  9. ^ Graham, Grötschel y Lovász 1995, pág. 1049
  10. ^ van Lint y Wilson 1992, págs.77-8
  11. ^ Björklund, Husfeldt y Koivisto 2009
  12. ^ Gross 2008, págs. 211-13
  13. ^ Gross 2008, págs. 208-10
  14. ^ Mazur 2010, págs. 84-5, 90
  15. ^ Brualdi 2010, págs. 177–81
  16. ^ Brualdi 2010, págs. 282-7
  17. ^ Roberts y Tesman 2009, páginas 419-20
  18. ^ van Lint y Wilson 1992, pág. 73
  19. ^ (Fernández, Fröhlich & Alan D. 1992, Proposición 12.6)

Referencias

  • Allenby, RBJT; Slomson, Alan (2010), Cómo contar: Introducción a la combinatoria, matemáticas discretas y sus aplicaciones (2.ª edición), CRC Press, págs. 51–60, ISBN 9781420082609
  • Björklund, A.; Husfeldt, T.; Koivisto, M. (2009), "Particionamiento de conjuntos mediante inclusión-exclusión", SIAM Journal on Computing , 39 (2): 546–563, CiteSeerX  10.1.1.526.9573 , doi :10.1137/070683933
  • Brualdi, Richard A. (2010), Combinatoria introductoria (5.ª ed.), Prentice–Hall, ISBN 9780136020400
  • Cameron, Peter J. (1994), Combinatoria: temas, técnicas, algoritmos , Cambridge University Press, ISBN 0-521-45761-0
  • Fernández, Roberto; Fröhlich, Jürg ; Alan D., Sokal (1992), Paseos aleatorios, fenómenos críticos y trivialidad en la teoría cuántica de campos , Textos y monografías en física, Berlín: Springer-Verlag , pp. xviii+444, ISBN 3-540-54358-9, MR  1219313, Zbl  0761.60061
  • Graham, RL; Grötschel, M .; Lovász, L. (1995), Manual de combinatoria (volumen 2) , MIT Press - Holanda Septentrional, ISBN 9780262071710
  • Gross, Jonathan L. (2008), Métodos combinatorios con aplicaciones informáticas , Chapman&Hall/CRC, ISBN 9781584887430
  • "Principio de inclusión y exclusión", Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
  • Mazur, David R. (2010), Combinatoria: una visita guiada , The Mathematical Association of America, ISBN 9780883857625
  • Roberts, Fred S.; Tesman, Barry (2009), Combinatoria aplicada (2.ª ed.), CRC Press, ISBN 9781420099829
  • Stanley, Richard P. (1986), Combinatoria enumerativa, volumen I , Wadsworth & Brooks/Cole, ISBN 0534065465
  • van Lint, JH; Wilson, RM (1992), Un curso de combinatoria , Cambridge University Press, ISBN 0521422604

Este artículo incorpora material del principio de inclusión-exclusión en PlanetMath , que se encuentra bajo la licencia Creative Commons Attribution/Share-Alike License .

Retrieved from "https://en.wikipedia.org/w/index.php?title=Inclusion–exclusion_principle&oldid=1251078631"