En teoría de probabilidad , un espacio de probabilidad estándar , también llamado espacio de probabilidad de Lebesgue-Rokhlin o simplemente espacio de Lebesgue (el último término es ambiguo), es un espacio de probabilidad que satisface ciertas suposiciones introducidas por Vladimir Rokhlin en 1940. De manera informal, es un espacio de probabilidad que consiste en un intervalo y/o un número finito o contable de átomos .
La teoría de los espacios de probabilidad estándar fue iniciada por von Neumann en 1932 y moldeada por Vladimir Rokhlin en 1940. Rokhlin demostró que el intervalo unitario dotado de la medida de Lebesgue tiene importantes ventajas sobre los espacios de probabilidad generales, pero puede sustituir eficazmente a muchos de ellos en la teoría de la probabilidad. La dimensión del intervalo unitario no es un obstáculo, como ya quedó claro para Norbert Wiener . Construyó el proceso de Wiener (también llamado movimiento browniano ) en forma de un mapa medible desde el intervalo unitario hasta el espacio de funciones continuas .
La teoría de los espacios de probabilidad estándar fue iniciada por von Neumann en 1932 [1] y moldeada por Vladimir Rokhlin en 1940. [2] Para presentaciones modernizadas, véase (Haezendonck 1973), (de la Rue 1993), (Itô 1984, Sect. 2.4) y (Rudolph 1990, Capítulo 2).
En la actualidad, los espacios de probabilidad estándar pueden ser tratados (y a menudo lo son) en el marco de la teoría descriptiva de conjuntos , a través de los espacios de Borel estándar , véase por ejemplo (Kechris 1995, Sect. 17). Este enfoque se basa en el teorema de isomorfismo para los espacios de Borel estándar (Kechris 1995, Teorema (15.6)). Un enfoque alternativo de Rokhlin, basado en la teoría de la medida , descuida los conjuntos nulos , en contraste con la teoría descriptiva de conjuntos. Los espacios de probabilidad estándar se utilizan rutinariamente en la teoría ergódica . [3] [4]
A continuación se ofrece una de varias definiciones equivalentes bien conocidas de la estandarización, después de algunas preparaciones. Se supone que todos los espacios de probabilidad son completos .
Un isomorfismo entre dos espacios de probabilidad , es un mapa invertible tal que y ambos son mapas (medibles y) que preservan la medida .
Dos espacios de probabilidad son isomorfos si existe un isomorfismo entre ellos.
Dos espacios de probabilidad , son isomorfos si existen conjuntos nulos , tales que los espacios de probabilidad , son isomorfos (están dotados naturalmente de campos sigma y medidas de probabilidad).
Un espacio de probabilidad es estándar si es isomorfo a un intervalo con medida de Lebesgue, a un conjunto finito o contable de átomos, o a una combinación (unión disjunta) de ambos.
Véase (Rokhlin 1952, Sect. 2.4 (p. 20)), (Haezendonck 1973, Proposición 6 (p. 249) y Observación 2 (p. 250)), y (de la Rue 1993, Teorema 4-3). Véase también (Kechris 1995, Sect. 17.F), e (Itô 1984, especialmente Sect. 2.4 y Ejercicio 3.1(v)). En (Petersen 1983, Definición 4.5 en la página 16) la medida se supone finita, no necesariamente probabilística. En (Sinai 1994, Definición 1 en la página 16) no se permiten átomos.
El espacio de todas las funciones puede considerarse como el producto de un continuo de copias de la línea real . Se puede dotar de una medida de probabilidad, digamos, la distribución normal estándar , y tratar el espacio de funciones como el producto de un continuo de espacios de probabilidad idénticos . La medida del producto es una medida de probabilidad en . Ingenuamente podría parecer que describe el ruido blanco .
Sin embargo, la integral de una función de ruido blanco de 0 a 1 debería ser una variable aleatoria distribuida N (0, 1). En cambio, la integral (de 0 a 1) de no está definida. ƒ tampoco es casi seguro que se pueda medir, y la probabilidad de que ƒ sea medible no está definida. De hecho, si X es una variable aleatoria distribuida (por ejemplo) uniformemente en (0, 1) e independiente de ƒ , entonces ƒ ( X ) no es una variable aleatoria en absoluto (carece de mensurabilidad).
Sea un conjunto cuya medida de Lebesgue interna es igual a 0, pero la medida de Lebesgue externa es igual a 1 (por lo tanto, no es medible en extremo). Existe una medida de probabilidad en tal que para cada medida de Lebesgue . (Aquí está la medida de Lebesgue). Los eventos y las variables aleatorias en el espacio de probabilidad (tratados como ) están en una correspondencia uno a uno natural con los eventos y las variables aleatorias en el espacio de probabilidad . Podría parecer que el espacio de probabilidad es tan bueno como .
Sin embargo, no es así. Una variable aleatoria definida por se distribuye uniformemente en . La medida condicional, dado , es solo un átomo (en ), siempre que sea el espacio de probabilidad subyacente. Sin embargo, si se utiliza en su lugar, entonces la medida condicional no existe cuando .
Un círculo perforado se construye de manera similar. Sus eventos y variables aleatorias son los mismos que en el círculo habitual. El grupo de rotaciones actúa sobre ellos de forma natural. Sin embargo, no actúa sobre el círculo perforado.
Véase también (Rudolph 1990, página 17).
Sea como en el ejemplo anterior. Conjuntos de la forma donde y son conjuntos arbitrarios medibles de Lebesgue, son una σ-álgebra que contiene la σ-álgebra de Lebesgue y La fórmula
da la forma general de una medida de probabilidad que extiende la medida de Lebesgue; aquí hay un parámetro. Para ser más específicos, elegimos Podría parecer que tal extensión de la medida de Lebesgue es al menos inofensiva.
Sin embargo, es el intervalo perforado disfrazado. El mapa
es un isomorfismo entre y el intervalo perforado correspondiente al conjunto
Otro conjunto de medida Lebesgue interna 0 pero medida Lebesgue externa 1.
Véase también (Rudolph 1990, Ejercicio 2.11 en la página 18).
La estandarización de un espacio de probabilidad dado es equivalente a una cierta propiedad de un mapa medible de a un espacio medible La respuesta (estándar o no) no depende de la elección de y . Este hecho es bastante útil; uno puede adaptar la elección de y a los casos dados No es necesario examinar todos los casos. Puede ser conveniente examinar una variable aleatoria un vector aleatorio una secuencia aleatoria o una secuencia de eventos tratados como una secuencia de variables aleatorias de dos valores,
Se impondrán dos condiciones a (ser inyectiva y generatriz). A continuación se supone que se dan tales condiciones. La cuestión de su existencia se abordará más adelante.
Se supone que el espacio de probabilidad es completo (de lo contrario, no puede ser estándar).
Una función medible induce una medida de empuje hacia adelante , – la medida de probabilidad definida por
es decir, la distribución de la variable aleatoria . La imagen es siempre un conjunto de medidas externas completas.
pero su medida interna puede diferir (ver intervalo perforado ). En otras palabras, no tiene por qué ser un conjunto de medidas completas.
Una función medible se llama generadora si es la completitud con respecto al σ-álgebra de imágenes inversas donde se ejecuta sobre todos los conjuntos de Borel.
Precaución. La siguiente condición no es suficiente para que sea generador: para cada existe un conjunto de Borel tal que ( significa diferencia simétrica ).
Teorema. Sea una función medible inyectiva y generatriz, entonces las dos condiciones siguientes son equivalentes:
Véase también (Itô 1984, Sect. 3.1).
El mismo teorema se cumple para cualquier (en lugar de ). Una función medible puede considerarse como una secuencia finita de variables aleatorias y es generadora si y solo si es la terminación del σ-álgebra generada por
El teorema sigue siendo válido para el espacio de secuencias infinitas. Una función medible puede considerarse como una secuencia infinita de variables aleatorias y es generadora si y solo si la terminación del σ-álgebra es generada por
En particular, si las variables aleatorias toman sólo dos valores 0 y 1, tratamos con una función medible y una secuencia de conjuntos. La función es generadora si y sólo si la terminación del σ-álgebra es generada por
En el trabajo pionero (Rokhlin 1952) las secuencias que corresponden a inyectivas, generadoras se denominan bases del espacio de probabilidad (véase Rokhlin 1952, Sect. 2.1). Una base se denomina completa módulo 0, si es de medida completa véase (Rokhlin 1952, Sect. 2.2). En la misma sección Rokhlin demostró que si un espacio de probabilidad es completo módulo 0 con respecto a alguna base, entonces es completo módulo 0 con respecto a cualquier otra base, y define los espacios de Lebesgue por esta propiedad de completitud. Véase también (Haezendonck 1973, Prop. 4 y Def. 7) y (Rudolph 1990, Sect. 2.3, especialmente el Teorema 2.2).
Los cuatro casos tratados anteriormente son mutuamente equivalentes y pueden unirse, ya que los espacios medibles y son mutuamente isomorfos; todos son espacios medibles estándar (en otras palabras, espacios de Borel estándar).
La existencia de una función medible inyectiva de un espacio medible estándar no depende de la elección de Tomando obtenemos la propiedad bien conocida como estar contablemente separado (pero llamada separable en Itô 1984).
La existencia de una función medible generadora de un espacio medible estándar tampoco depende de la elección de Tomando obtenemos la propiedad bien conocida como ser contablemente generado (mod 0), ver (Durrett 1996, Ejercicio I.5).
Espacio de probabilidad | Separados de manera contable | Generado de forma contable | Estándar |
---|---|---|---|
Intervalo con medida de Lebesgue | Sí | Sí | Sí |
Ruido blanco ingenuo | No | No | No |
Intervalo perforado | Sí | Sí | No |
Toda función medible inyectiva de un espacio de probabilidad estándar a un espacio medible estándar es generadora. Véase (Rokhlin 1952, Sect. 2.5), (Haezendonck 1973, Corolario 2 en la página 253), (de la Rue 1993, Teoremas 3-4 y 3-5). Esta propiedad no se cumple para el espacio de probabilidad no estándar tratado en la subsección "Un conjunto medible superfluo" anterior.
Precaución. La propiedad de ser generado de manera contable es invariante bajo isomorfismos módulo 0, pero la propiedad de estar separado de manera contable no lo es. De hecho, un espacio de probabilidad estándar está separado de manera contable si y solo si la cardinalidad de no excede el continuo (véase Itô 1984, Ejercicio 3.1(v)). Un espacio de probabilidad estándar puede contener un conjunto nulo de cualquier cardinalidad, por lo tanto, no necesita estar separado de manera contable. Sin embargo, siempre contiene un subconjunto separado de manera contable de medida completa.
Sea un espacio de probabilidad completo tal que la cardinalidad de no exceda el continuo (el caso general se reduce a este caso especial, vea la precaución anterior).
Definición. Es estándar si está separado de forma contable, se genera de forma contable y es absolutamente medible.
Véase (Rokhlin 1952, final de la sección 2.3) y (Haezendonck 1973, Observación 2 en la página 248). "Absolutamente medible" significa: medible en todo espacio de probabilidad numerablemente separado y numerablemente generado que lo contenga.
Definición. es estándar si está separado contablemente y es perfecto.
Véase (Itô 1984, Sect. 3.1). "Perfecto" significa que para cada función medible desde hasta la medida imagen es regular . (Aquí la medida imagen se define en todos los conjuntos cuyas imágenes inversas pertenecen a , independientemente de la estructura de Borel de ).
Definición. es estándar si existe una topología tal que
Véase (de la Rue 1993, sección 1).
Toda distribución de probabilidad en el espacio lo convierte en un espacio de probabilidad estándar. (Aquí, una distribución de probabilidad significa una medida de probabilidad definida inicialmente en el álgebra sigma de Borel y completada).
Lo mismo se aplica a cada espacio polaco , véase (Rokhlin 1952, Sect. 2.7 (p. 24)), (Haezendonck 1973, Ejemplo 1 (p. 248)), (de la Rue 1993, Teorema 2-3), y (Itô 1984, Teorema 2.4.1).
Por ejemplo, la medida de Wiener convierte el espacio polaco (de todas las funciones continuas dotadas de la topología de convergencia uniforme local ) en un espacio de probabilidad estándar.
Otro ejemplo: para cada secuencia de variables aleatorias, su distribución conjunta convierte el espacio polaco (de secuencias; dotado de la topología de producto ) en un espacio de probabilidad estándar.
(Por tanto, la idea de dimensión , muy natural para los espacios topológicos , es totalmente inadecuada para los espacios de probabilidad estándar.)
El producto de dos espacios de probabilidad estándar es un espacio de probabilidad estándar.
Lo mismo se aplica al producto de un número contable de espacios, véase (Rokhlin 1952, Sect. 3.4), (Haezendonck 1973, Proposición 12), y (Itô 1984, Teorema 2.4.3).
Un subconjunto medible de un espacio de probabilidad estándar es un espacio de probabilidad estándar. Se supone que el conjunto no es un conjunto nulo y que está dotado de la medida condicional. Véase (Rokhlin 1952, Sect. 2.3 (p. 14)) y (Haezendonck 1973, Proposición 5).
Cada medida de probabilidad en un espacio de Borel estándar lo convierte en un espacio de probabilidad estándar.
En la configuración discreta, la probabilidad condicional es otra medida de probabilidad, y la expectativa condicional puede ser tratada como la expectativa (usual) con respecto a la medida condicional, ver expectativa condicional . En la configuración no discreta, el condicionamiento a menudo se trata indirectamente, ya que la condición puede tener probabilidad 0, ver expectativa condicional . Como resultado, una serie de hechos bien conocidos tienen contrapartes "condicionales" especiales. Por ejemplo: linealidad de la expectativa; desigualdad de Jensen (ver expectativa condicional ); desigualdad de Hölder ; el teorema de convergencia monótona , etc.
Dada una variable aleatoria en un espacio de probabilidad , es natural intentar construir una medida condicional , es decir, la distribución condicional de dado . En general, esto es imposible (véase Durrett 1996, Sect. 4.1(c)). Sin embargo, para un espacio de probabilidad estándar esto es posible, y bien conocido como sistema canónico de medidas (véase Rokhlin 1952, Sect. 3.1), que es básicamente lo mismo que las medidas de probabilidad condicional (véase Itô 1984, Sect. 3.5), la desintegración de la medida (véase Kechris 1995, Ejercicio (17.35)) y las probabilidades condicionales regulares (véase Durrett 1996, Sect. 4.1(c)).
La desigualdad de Jensen condicional es simplemente la desigualdad de Jensen (habitual) aplicada a la medida condicional. Lo mismo se aplica a muchos otros hechos.
Dados dos espacios de probabilidad , y un mapa que preserva la medida , la imagen no necesita cubrir todo , puede omitir un conjunto nulo. Puede parecer que tiene que ser igual a 1, pero no es así. La medida externa de es igual a 1, pero la medida interna puede diferir. Sin embargo, si los espacios de probabilidad , son estándar entonces , véase (de la Rue 1993, Teorema 3-2). Si también es uno a uno entonces cada satisface , . Por lo tanto, es medible (y preserva la medida). Véase (Rokhlin 1952, Sect. 2.5 (p. 20)) y (de la Rue 1993, Teorema 3-5). Véase también (Haezendonck 1973, Proposición 9 (y Observación después de ella)).
"Hay una manera coherente de ignorar los conjuntos de medida 0 en un espacio de medida" (Petersen 1983, página 15). En un esfuerzo por deshacerse de los conjuntos nulos, los matemáticos a menudo usan clases de equivalencia de conjuntos o funciones mensurables. Las clases de equivalencia de subconjuntos mensurables de un espacio de probabilidad forman un álgebra booleana completa normada llamada álgebra de medida (o estructura métrica). Toda función que preserva la medida conduce a un homomorfismo de álgebras de medida; básicamente, para .
Puede parecer que cada homomorfismo de las álgebras de medida tiene que corresponder a alguna función que preserve la medida, pero no es así. Sin embargo, para los espacios de probabilidad estándar cada uno corresponde a algún . Véase (Rokhlin 1952, Sect. 2.6 (p. 23) y 3.2), (Kechris 1995, Sect. 17.F), (Petersen 1983, Teorema 4.7 en la página 17).
"Espacio de probabilidad estándar", Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
{{citation}}
: CS1 maint: location missing publisher (link).