En teoría de probabilidad y estadística , la distribución de probabilidad condicional es una distribución de probabilidad que describe la probabilidad de un resultado dada la ocurrencia de un evento particular. Dadas dos variables aleatorias distribuidas conjuntamente y , la distribución de probabilidad condicional de dado es la distribución de probabilidad de cuando se sabe que es un valor particular; en algunos casos, las probabilidades condicionales pueden expresarse como funciones que contienen el valor no especificado de como parámetro. Cuando tanto y son variables categóricas , se utiliza típicamente una tabla de probabilidad condicional para representar la probabilidad condicional. La distribución condicional contrasta con la distribución marginal de una variable aleatoria, que es su distribución sin referencia al valor de la otra variable.
De manera más general, se puede hacer referencia a la distribución condicional de un subconjunto de un conjunto de más de dos variables; esta distribución condicional depende de los valores de todas las variables restantes, y si se incluye más de una variable en el subconjunto, entonces esta distribución condicional es la distribución condicional conjunta de las variables incluidas.
Distribuciones discretas condicionales
Para variables aleatorias discretas , la función de masa de probabilidad condicional dada se puede escribir según su definición como:
Debido a la ocurrencia de en el denominador, esto se define solo para valores distintos de cero (por lo tanto, estrictamente positivo).
La relación con la distribución de probabilidad dada es:
Ejemplo
Considere el lanzamiento de un dado justo y suponga que el número es par (es decir, 2, 4 o 6) y en los demás casos. Además, suponga que el número es primo (es decir, 2, 3 o 5) y en los demás casos.
D
1
2
3
4
5
6
incógnita
0
1
0
1
0
1
Y
0
1
1
0
1
0
Entonces, la probabilidad incondicional es 3/6 = 1/2 (ya que hay seis tiradas posibles de los dados, de las cuales tres son pares), mientras que la probabilidad condicional es 1/3 (ya que hay tres tiradas posibles de números primos —2, 3 y 5— de las cuales una es par).
La relación con la distribución de probabilidad dada viene dada por:
El concepto de distribución condicional de una variable aleatoria continua no es tan intuitivo como podría parecer: la paradoja de Borel muestra que las funciones de densidad de probabilidad condicional no necesitan ser invariantes bajo transformaciones de coordenadas.
Ejemplo
El gráfico muestra una densidad normal conjunta bivariada para variables aleatorias y . Para ver la distribución de condicional en , primero se puede visualizar la línea en el plano y luego visualizar el plano que contiene esa línea y es perpendicular al plano. La intersección de ese plano con la densidad normal conjunta, una vez reescalada para dar el área unitaria bajo la intersección, es la densidad condicional relevante de .
Relación con la independencia
Las variables aleatorias , son independientes si y solo si la distribución condicional de dada es, para todas las posibles realizaciones de , igual a la distribución incondicional de . Para las variables aleatorias discretas esto significa para todas las posibles y con . Para las variables aleatorias continuas y , que tienen una función de densidad conjunta , significa para todas las posibles y con .
Propiedades
Vista como una función de para dado , es una función de masa de probabilidad y, por lo tanto, la suma total (o integral si es una densidad de probabilidad condicional) es 1. Vista como una función de para dado , es una función de verosimilitud , por lo que la suma (o integral) total no necesita ser 1.
Además, un valor marginal de una distribución conjunta se puede expresar como la esperanza de la distribución condicional correspondiente. Por ejemplo, .
Formulación teórica de la medida
Sea un espacio de probabilidad, un -cuerpo en . Dado , el teorema de Radon-Nikodym implica que existe [3] una variable aleatoria -medible , llamada probabilidad condicional , tal que para cada , y dicha variable aleatoria está definida de forma única hasta conjuntos de probabilidad cero. Una probabilidad condicional se llama regular si es una medida de probabilidad en para todos los ae
Casos especiales:
Para el álgebra sigma trivial , la probabilidad condicional es la función constante
Si , entonces , la función indicadora (definida a continuación).
Sea una variable aleatoria con valor . Para cada , defina Para cualquier , la función se denomina distribución de probabilidad condicional de dado . Si es una medida de probabilidad de , entonces se denomina regular .
Para una variable aleatoria de valor real (con respecto al campo de Borel en ), toda distribución de probabilidad condicional es regular. [4] En este caso, casi con seguridad.
que es una variable aleatoria. Nótese que la expectativa de esta variable aleatoria es igual a la probabilidad de A en sí:
Dado un campo , la probabilidad condicional es una versión de la expectativa condicional de la función indicadora para :
La expectativa de una variable aleatoria con respecto a una probabilidad condicional regular es igual a su expectativa condicional.
Interpretación del condicionamiento en un campo sigma
Consideremos el espacio de probabilidad
y un campo subsigma . El campo subsigma puede interpretarse libremente como que contiene un subconjunto de la información en . Por ejemplo, podríamos pensar en como la probabilidad del evento dada la información en .
Recuerde también que un evento es independiente de un campo subsigma si para todo . Es incorrecto concluir en general que la información en no nos dice nada sobre la probabilidad de que ocurra el evento. Esto se puede demostrar con un contraejemplo:
Consideremos un espacio de probabilidad en el intervalo unitario, . Sea el cuerpo sigma de todos los conjuntos contables y conjuntos cuyo complemento es contable. Por lo tanto, cada conjunto en tiene medida o y, por lo tanto, es independiente de cada evento en . Sin embargo, observe que también contiene todos los eventos singulares en (aquellos conjuntos que contienen solo un único ). Por lo tanto, ¡saber cuál de los eventos en ocurrió es equivalente a saber exactamente cuál ocurrió! Por lo tanto, en un sentido, no contiene información sobre (es independiente de él), y en otro sentido contiene toda la información en . [5]