Ergodicidad

Propiedad del movimiento que llena uniformemente el espacio

En matemáticas , la ergodicidad expresa la idea de que un punto de un sistema en movimiento, ya sea un sistema dinámico o un proceso estocástico , visitará eventualmente todas las partes del espacio en el que se mueve el sistema, en un sentido uniforme y aleatorio. Esto implica que el comportamiento promedio del sistema puede deducirse de la trayectoria de un punto "típico". De manera equivalente, una colección suficientemente grande de muestras aleatorias de un proceso puede representar las propiedades estadísticas promedio de todo el proceso. La ergodicidad es una propiedad del sistema; es una afirmación de que el sistema no puede reducirse o factorizarse en componentes más pequeños. La teoría ergódica es el estudio de los sistemas que poseen ergodicidad.

Los sistemas ergódicos se dan en una amplia gama de sistemas en física y geometría . Esto puede entenderse, a grandes rasgos, como debido a un fenómeno común: el movimiento de las partículas, es decir, las geodésicas en una variedad hiperbólica son divergentes; cuando esa variedad es compacta , es decir, de tamaño finito, esas órbitas regresan a la misma área general , y finalmente llenan todo el espacio.

Los sistemas ergódicos captan las nociones cotidianas y de sentido común de aleatoriedad, de modo que el humo puede llenar toda una habitación llena de humo, o que un bloque de metal puede llegar a tener la misma temperatura en todo su perímetro, o que al lanzar una moneda al aire puede salir cara o cruz la mitad de las veces. Un concepto más sólido que la ergodicidad es el de mezcla , que pretende describir matemáticamente las nociones de sentido común de mezcla, como mezclar bebidas o mezclar ingredientes para cocinar.

La formulación matemática adecuada de la ergodicidad se basa en las definiciones formales de la teoría de la medida y de los sistemas dinámicos , y más concretamente en la noción de un sistema dinámico que preserva la medida . Los orígenes de la ergodicidad se encuentran en la física estadística , donde Ludwig Boltzmann formuló la hipótesis ergódica .

Explicación informal

La ergodicidad se da en muchos ámbitos de la física y las matemáticas . [1] Todos estos ámbitos están unificados por una descripción matemática común, la del sistema dinámico que preserva la medida . De manera equivalente, la ergodicidad puede entenderse en términos de procesos estocásticos . Son uno y lo mismo, a pesar de utilizar una notación y un lenguaje radicalmente diferentes.

Sistemas dinámicos que preservan la medida

La definición matemática de ergodicidad pretende capturar las ideas cotidianas comunes sobre la aleatoriedad . Esto incluye ideas sobre sistemas que se mueven de tal manera que (eventualmente) llenan todo el espacio, como la difusión y el movimiento browniano , así como nociones de sentido común sobre mezclas, como mezclar pinturas, bebidas, ingredientes para cocinar, mezclar en procesos industriales , el humo en una habitación llena de humo, el polvo en los anillos de Saturno , etc. Para proporcionar una base matemática sólida, las descripciones de los sistemas ergódicos comienzan con la definición de un sistema dinámico que preserva la medida . Esto se escribe como ( incógnita , A , micras , yo ) . {\displaystyle (X,{\mathcal {A}},\mu ,T).}

El conjunto se entiende como el espacio total a llenar: el cuenco de mezclas, la habitación llena de humo, etc. La medida se entiende como la definición del volumen natural del espacio y de sus subespacios. La colección de subespacios se denota por , y el tamaño de cualquier subconjunto dado es ; el tamaño es su volumen. Ingenuamente, uno podría imaginar que es el conjunto potencia de ; esto no funciona del todo, ya que no todos los subconjuntos de un espacio tienen un volumen (famosa, la paradoja de Banach-Tarski ). Por lo tanto, convencionalmente, consta de los subconjuntos medibles, los subconjuntos que sí tienen un volumen. Siempre se toma como un conjunto de Borel , la colección de subconjuntos que se pueden construir tomando intersecciones , uniones y complementos de conjuntos abiertos ; estos siempre se pueden tomar como medibles. incógnita {\estilo de visualización X} micras {\estilo de visualización \mu} incógnita {\estilo de visualización X} A {\displaystyle {\mathcal {A}}} A incógnita {\displaystyle A\subconjunto X} micras ( A ) {\displaystyle \mu (A)} A {\displaystyle {\mathcal {A}}} incógnita {\estilo de visualización X} A {\displaystyle {\mathcal {A}}}

La evolución temporal del sistema se describe mediante un mapa . Dado un subconjunto , su mapa será en general una versión deformada de : se aplasta o se estira, se pliega o se corta en pedazos. Algunos ejemplos matemáticos incluyen el mapa del panadero y el mapa de herradura , ambos inspirados en la elaboración del pan . El conjunto debe tener el mismo volumen que ; el aplastamiento o el estiramiento no altera el volumen del espacio, solo su distribución. Un sistema de este tipo es "preservador de la medida" (preserva el área, preserva el volumen). yo : incógnita incógnita {\displaystyle T:X\a X} A incógnita {\displaystyle A\subconjunto X} yo ( A ) {\displaystyle T(A)} A {\estilo de visualización A} yo ( A ) {\displaystyle T(A)} A {\estilo de visualización A}

Una dificultad formal surge cuando uno intenta reconciliar el volumen de los conjuntos con la necesidad de preservar su tamaño bajo una función. El problema surge porque, en general, varios puntos diferentes en el dominio de una función pueden mapearse al mismo punto en su rango; es decir, puede haber con . Peor aún, un único punto no tiene tamaño. Estas dificultades se pueden evitar trabajando con la función inversa ; mapeará cualquier subconjunto dado a las partes que se ensamblaron para formar el mismo: estas partes son . Tiene la propiedad importante de no perder la pista de dónde vinieron las cosas. Más fuertemente, tiene la propiedad importante de que cualquier función (que preserva la medida) es la inversa de alguna función . La definición adecuada de una función que preserva el volumen es una para la cual porque describe todas las partes de las que vinieron. incógnita y {\displaystyle x\neq y} yo ( incógnita ) = yo ( y ) {\displaystyle T(x)=T(y)} incógnita incógnita {\displaystyle x\en X} yo 1 : A A {\displaystyle T^{-1}:{\mathcal {A}}\to {\mathcal {A}}} A incógnita {\displaystyle A\subconjunto X} yo 1 ( A ) A {\displaystyle T^{-1}(A)\in {\mathcal {A}}} A A {\displaystyle {\mathcal {A}}\to {\mathcal {A}}} incógnita incógnita {\displaystyle X\a X} micras ( A ) = micras ( yo 1 ( A ) ) {\displaystyle \mu(A)=\mu {\mathord {\left(T^{-1}(A)\right)}}} yo 1 ( A ) Estilo de visualización T-1(A) A {\estilo de visualización A}

Ahora nos interesa estudiar la evolución temporal del sistema. Si un conjunto llega a llenar la totalidad de durante un largo período de tiempo (es decir, si se acerca a la totalidad de para valores grandes de ), se dice que el sistema es ergódico . Si cada conjunto se comporta de esta manera, el sistema es un sistema conservativo , en contraste con un sistema disipativo , donde algunos subconjuntos se alejan , para nunca volver a ellos. Un ejemplo sería el agua que corre cuesta abajo: una vez que se ha reducido, nunca volverá a subir. Sin embargo, el lago que se forma en el fondo de este río puede llegar a estar bien mezclado. El teorema de descomposición ergódica establece que cada sistema ergódico se puede dividir en dos partes: la parte conservativa y la parte disipativa. A A {\displaystyle A\in {\mathcal {A}}} incógnita {\estilo de visualización X} yo norte ( A ) Estilo de visualización T^{n}(A)} incógnita {\estilo de visualización X} norte {\estilo de visualización n} A {\estilo de visualización A} A {\estilo de visualización A}

La mezcla es una afirmación más fuerte que la ergodicidad. La mezcla exige que esta propiedad ergódica se cumpla entre dos conjuntos cualesquiera , y no solo entre algún conjunto y . Es decir, dados dos conjuntos cualesquiera , se dice que un sistema es (topológicamente) mixto si hay un entero tal que, para todos y , se tiene que . Aquí, denota la intersección de conjuntos y es el conjunto vacío . Otras nociones de mezcla incluyen la mezcla fuerte y débil, que describen la noción de que las sustancias mezcladas se entremezclan en todas partes, en igual proporción. Esto puede no ser trivial, como lo demuestra la experiencia práctica de intentar mezclar sustancias pegajosas y viscosas. A , B {\estilo de visualización A,B} A {\estilo de visualización A} incógnita {\estilo de visualización X} A , B A {\displaystyle A,B\en {\mathcal {A}}} norte {\estilo de visualización N} A , B {\estilo de visualización A,B} norte > norte {\estilo de visualización n>N} yo norte ( A ) B {\displaystyle T^{n}(A)\cap B\neq \varnothing} {\displaystyle \cap} {\displaystyle \varnothing}

Procesos ergódicos

La discusión anterior apela a un sentido físico de volumen. El volumen no tiene que ser literalmente una porción de espacio 3D ; puede ser un volumen abstracto. Este es generalmente el caso en los sistemas estadísticos, donde el volumen (la medida) está dado por la probabilidad. El volumen total corresponde a la probabilidad uno. Esta correspondencia funciona porque los axiomas de la teoría de la probabilidad son idénticos a los de la teoría de la medida ; estos son los axiomas de Kolmogorov . [2]

La idea de volumen puede ser muy abstracta. Consideremos, por ejemplo, el conjunto de todos los lanzamientos de moneda posibles: el conjunto de secuencias infinitas de caras y cruces. Si asignamos el volumen de 1 a este espacio, queda claro que la mitad de todas esas secuencias comienzan con caras y la otra mitad con cruces. Se puede dividir este volumen de otras maneras: se puede decir "No me importan los primeros lanzamientos de moneda, pero quiero que el 'ésimo de ellos sea cara, y luego no me importa lo que venga después". Esto se puede escribir como el conjunto donde es "no me importa" y es "cara". El volumen de este espacio es nuevamente la mitad. norte 1 {\estilo de visualización n-1} norte {\estilo de visualización n} ( , , , yo , , ) {\displaystyle (*,\cdots ,*,h,*,\cdots )} {\estilo de visualización *} yo {\estilo de visualización h}

Lo anterior es suficiente para construir un sistema dinámico que preserva la medida, en su totalidad. Los conjuntos de o que ocurren en el 'ésimo lugar se llaman conjuntos cilíndricos . El conjunto de todas las posibles intersecciones, uniones y complementos de los conjuntos cilíndricos forman entonces el conjunto de Borel definido anteriormente. En términos formales, los conjuntos cilíndricos forman la base para una topología en el espacio de todos los lanzamientos de moneda de longitud infinita posibles. La medida tiene todas las propiedades de sentido común que uno podría esperar: la medida de un conjunto cilíndrico con en la 'ésima posición, y en la 'ésima posición es obviamente 1/4, y así sucesivamente. Estas propiedades de sentido común persisten para el complemento de conjunto y la unión de conjuntos: todo excepto y en las posiciones y obviamente tiene el volumen de 3/4. En conjunto, estos forman los axiomas de una medida sigma-aditiva ; los sistemas dinámicos que preservan la medida siempre usan medidas sigma-aditivas. Para los lanzamientos de moneda, esta medida se llama medida de Bernoulli . yo {\estilo de visualización h} a {\estilo de visualización t} norte {\estilo de visualización n} A {\displaystyle {\mathcal {A}}} incógnita {\estilo de visualización X} micras {\estilo de visualización \mu} yo {\estilo de visualización h} metro {\estilo de visualización m} a {\estilo de visualización t} a {\estilo de visualización k} yo {\estilo de visualización h} a {\estilo de visualización t} metro {\estilo de visualización m} a {\estilo de visualización k}

Para el proceso de lanzamiento de moneda, el operador de evolución temporal es el operador de desplazamiento que dice "descarta el primer lanzamiento de moneda y quédate con el resto". Formalmente, si es una secuencia de lanzamientos de moneda, entonces . La medida es obviamente invariante con respecto al desplazamiento: siempre que estemos hablando de algún conjunto donde el primer lanzamiento de moneda es el valor "no importa", entonces el volumen no cambia: . Para evitar hablar del primer lanzamiento de moneda, es más fácil definirlo como insertar un valor "no importa" en la primera posición: . Con esta definición, obviamente se tiene eso sin restricciones en . Este es nuevamente un ejemplo de por qué se usa en las definiciones formales. yo {\estilo de visualización T} ( incógnita 1 , incógnita 2 , ) {\displaystyle (x_{1},x_{2},\cpuntos)} yo ( incógnita 1 , incógnita 2 , ) = ( incógnita 2 , incógnita 3 , ) {\displaystyle T(x_{1},x_{2},\cdots )=(x_{2},x_{3},\cdots )} A A {\displaystyle A\in {\mathcal {A}}} incógnita 1 = estilo de visualización x_{1}=*} micras ( A ) {\displaystyle \mu (A)} micras ( A ) = micras ( yo ( A ) ) {\displaystyle \mu(A)=\mu(T(A))} yo 1 Estilo de visualización T-1 yo 1 ( incógnita 1 , incógnita 2 , ) = ( , incógnita 1 , incógnita 2 , ) {\displaystyle T^{-1}(x_{1},x_{2},\cdots )=(*,x_{1},x_{2},\cdots )} micras ( yo 1 ( A ) ) = micras ( A ) {\displaystyle \mu {\mathord {\left(T^{-1}(A)\right)}}=\mu (A)} A {\estilo de visualización A} yo 1 Estilo de visualización T-1

El desarrollo anterior toma un proceso aleatorio, el proceso de Bernoulli, y lo convierte en un sistema dinámico que preserva la medida. La misma conversión (equivalencia, isomorfismo) se puede aplicar a cualquier proceso estocástico . Por lo tanto, una definición informal de ergodicidad es que una secuencia es ergódica si visita todos los ; tales secuencias son "típicas" para el proceso. Otra es que sus propiedades estadísticas se pueden deducir de una sola muestra aleatoria suficientemente larga del proceso (muestreando así uniformemente todos los ), o que cualquier colección de muestras aleatorias de un proceso debe representar las propiedades estadísticas promedio de todo el proceso (es decir, las muestras extraídas uniformemente de son representativas de como un todo). En el presente ejemplo, una secuencia de lanzamientos de moneda, donde la mitad son caras y la otra mitad son cruces, es una secuencia "típica". ( incógnita , A , micras , yo ) . {\displaystyle (X,{\mathcal {A}},\mu ,T).} incógnita {\estilo de visualización X} incógnita {\estilo de visualización X} incógnita {\estilo de visualización X} incógnita {\estilo de visualización X}

Hay varios puntos importantes que se deben tener en cuenta acerca del proceso de Bernoulli. Si se escribe 0 para las cruces y 1 para las caras, se obtiene el conjunto de todas las cadenas infinitas de dígitos binarios. Estos corresponden a la expansión en base dos de los números reales . Explícitamente, dada una secuencia , el número real correspondiente es ( incógnita 1 , incógnita 2 , ) {\displaystyle (x_{1},x_{2},\cpuntos)}

y = norte = 1 incógnita norte 2 norte {\displaystyle y=\sum _{n=1}^{\infty }{\frac {x_{n}}{2^{n}}}}

La afirmación de que el proceso de Bernoulli es ergódico es equivalente a la afirmación de que los números reales están distribuidos uniformemente. El conjunto de todas esas cadenas se puede escribir de diversas maneras: Este conjunto es el conjunto de Cantor , a veces llamado espacio de Cantor para evitar confusiones con la función de Cantor. { yo , a } = { yo , a } ω = { 0 , 1 } ω = 2 ω = 2 norte . {\displaystyle \{h,t\}^{\infty }=\{h,t\}^{\omega }=\{0,1\}^{\omega }=2^{\omega }=2^{\mathbb {N} }.}

do ( incógnita ) = norte = 1 incógnita norte 3 norte {\displaystyle C(x)=\sum _{n=1}^{\infty }{\frac {x_{n}}{3^{n}}}}

Al final, todo es "la misma cosa".

El conjunto de Cantor desempeña papeles clave en muchas ramas de las matemáticas. En las matemáticas recreativas, sustenta los fractales de duplicación de período ; en el análisis , aparece en una amplia variedad de teoremas. Uno clave para los procesos estocásticos es la descomposición de Wold , que establece que cualquier proceso estacionario puede descomponerse en un par de procesos no correlacionados, uno determinista y el otro un proceso de promedio móvil .

El teorema de isomorfismo de Ornstein establece que todo proceso estocástico estacionario es equivalente a un esquema de Bernoulli (un proceso de Bernoulli con un dado de juego de N lados (y posiblemente injusto) ). Otros resultados incluyen que todo sistema ergódico no disipativo es equivalente al odómetro de Markov , a veces llamado "máquina de sumar" porque parece una suma de escuela primaria, es decir, tomar una secuencia de dígitos de base N , sumar uno y propagar los bits de acarreo. La prueba de equivalencia es muy abstracta; comprender el resultado no lo es: al sumar uno en cada paso de tiempo, se visita cada estado posible del odómetro, hasta que se da vuelta y comienza de nuevo. Del mismo modo, los sistemas ergódicos visitan cada estado, de manera uniforme, pasando al siguiente, hasta que todos han sido visitados.

Los sistemas que generan secuencias (infinitas) de N letras se estudian mediante dinámica simbólica . Entre los casos especiales importantes se encuentran los subdesplazamientos de tipo finito y los sistemas sóficos .

Historia y etimología

Se cree comúnmente que el término ergódico deriva de las palabras griegas ἔργον ( ergon : "trabajo") y ὁδός ( hodos : "sendero", "camino"), elegidas por Ludwig Boltzmann mientras trabajaba en un problema de mecánica estadística . [3] Al mismo tiempo, también se afirma que es una derivación de ergomonode , acuñado por Boltzmann en un artículo relativamente oscuro de 1884. La etimología parece ser controvertida también de otras maneras. [4]

La idea de ergodicidad nació en el campo de la termodinámica , donde era necesario relacionar los estados individuales de las moléculas de un gas con la temperatura de un gas en su conjunto y su evolución temporal. Para ello, era necesario enunciar qué significa exactamente que los gases se mezclen bien entre sí, de modo que se pudiera definir el equilibrio termodinámico con rigor matemático . Una vez que la teoría estuvo bien desarrollada en física , se formalizó y amplió rápidamente, de modo que la teoría ergódica ha sido durante mucho tiempo un área independiente de las matemáticas en sí misma. Como parte de esa progresión, coexisten más de una definición ligeramente diferente de ergodicidad y multitud de interpretaciones del concepto en diferentes campos. [ cita requerida ]

Por ejemplo, en física clásica el término implica que un sistema satisface la hipótesis ergódica de la termodinámica , [5] siendo el espacio de estados relevante el espacio de posición y el espacio de momento .

En la teoría de sistemas dinámicos, el espacio de estados se suele considerar un espacio de fases más general . Por otra parte, en la teoría de la codificación, el espacio de estados suele ser discreto tanto en el tiempo como en el estado, con una estructura concomitante menor. En todos esos campos, las ideas de promedio temporal y promedio de conjunto también pueden conllevar un bagaje adicional, como es el caso de las muchas posibles funciones de partición termodinámicamente relevantes que se utilizan para definir promedios de conjunto en física. Como tal, la formalización teórica de la medida del concepto también sirve como una disciplina unificadora. En 1913, Michel Plancherel demostró la estricta imposibilidad de ergodicidad para un sistema puramente mecánico. [6]

Ergodicidad en física y geometría

A continuación se presenta una revisión de la ergodicidad en física y geometría . En todos los casos, la noción de ergodicidad es exactamente la misma que para los sistemas dinámicos; no hay diferencias , excepto en la perspectiva, la notación, el estilo de pensamiento y las revistas donde se publican los resultados.

Los sistemas físicos se pueden dividir en tres categorías: mecánica clásica , que describe máquinas con un número finito de partes móviles, mecánica cuántica , que describe la estructura de los átomos, y mecánica estadística , que describe gases, líquidos y sólidos; esto incluye la física de la materia condensada . Estos se presentan a continuación.

En mecánica estadística

Esta sección revisa la ergodicidad en mecánica estadística. La definición abstracta anterior de un volumen es necesaria como el entorno apropiado para las definiciones de ergodicidad en física . Considere un contenedor de líquido , o gas , o plasma , u otra colección de átomos o partículas . Todas y cada una de las partículas tienen una posición 3D y una velocidad 3D, y por lo tanto se describen mediante seis números: un punto en el espacio de seis dimensiones Si hay de estas partículas en el sistema, una descripción completa requiere números. Cualquier sistema es solo un único punto en El sistema físico no es todo de , por supuesto; si es una caja de ancho, alto y largo, entonces un punto está en Las velocidades tampoco pueden ser infinitas: se escalan mediante alguna medida de probabilidad, por ejemplo, la medida de Boltzmann-Gibbs para un gas. No obstante, para cerca del número de Avogadro , este es obviamente un espacio muy grande. Este espacio se llama conjunto canónico . incógnita i Estilo de visualización x_{i}} R 6 . {\displaystyle \mathbb {R} ^{6}.} norte {\estilo de visualización N} 6 norte {\displaystyle 6N} R 6 N . {\displaystyle \mathbb {R} ^{6N}.} R 6 N {\displaystyle \mathbb {R} ^{6N}} W × H × L {\displaystyle W\times H\times L} ( W × H × L × R 3 ) N . {\displaystyle \left(W\times H\times L\times \mathbb {R} ^{3}\right)^{N}.} N {\displaystyle N}

Se dice que un sistema físico es ergódico si cualquier punto representativo del sistema llega a visitar eventualmente todo el volumen del sistema. Para el ejemplo anterior, esto implica que cualquier átomo dado no solo visita cada parte de la caja con probabilidad uniforme, sino que lo hace con cada velocidad posible, con probabilidad dada por la distribución de Boltzmann para esa velocidad (por lo tanto, uniforme con respecto a esa medida). La hipótesis ergódica establece que los sistemas físicos en realidad son ergódicos. Hay múltiples escalas de tiempo en juego: los gases y los líquidos parecen ser ergódicos en escalas de tiempo cortas. La ergodicidad en un sólido puede verse en términos de los modos vibracionales o fonones , ya que obviamente los átomos en un sólido no intercambian ubicaciones. Los vidrios presentan un desafío a la hipótesis ergódica; se supone que las escalas de tiempo están en millones de años, pero los resultados son controvertidos. Los vidrios de espín presentan dificultades particulares. W × H × L {\displaystyle W\times H\times L}

Las pruebas matemáticas formales de ergodicidad en física estadística son difíciles de conseguir; se supone que la mayoría de los sistemas de muchos cuerpos de alta dimensión son ergódicos, sin prueba matemática. Las excepciones incluyen el billar dinámico , que modela colisiones de átomos de tipo bola de billar en un gas ideal o plasma. El primer teorema de ergodicidad de esfera dura fue para el billar de Sinai , que considera dos bolas, una de ellas tomada como estacionaria, en el origen. Cuando la segunda bola choca, se aleja; aplicando condiciones de contorno periódicas, luego regresa para colisionar nuevamente. Apelando a la homogeneidad, este regreso de la "segunda" bola puede en cambio tomarse como "solo otro átomo" que ha entrado en rango y se está moviendo para colisionar con el átomo en el origen (que puede tomarse como "cualquier otro átomo"). Esta es una de las pocas pruebas formales que existen; No existen afirmaciones equivalentes, por ejemplo, para los átomos en un líquido que interactúan a través de fuerzas de van der Waals , aunque sería de sentido común creer que tales sistemas son ergódicos (y mixtos). Sin embargo, se pueden hacer argumentos físicos más precisos.

Sistemas dinámicos simples

El estudio formal de la ergodicidad se puede abordar examinando sistemas dinámicos bastante simples. Algunos de los principales se enumeran aquí.

La rotación irracional de un círculo es ergódica: la órbita de un punto es tal que, eventualmente, se visita cada uno de los demás puntos del círculo. Tales rotaciones son un caso especial del mapa de intercambio de intervalos . Las expansiones beta de un número son ergódicas: las expansiones beta de un número real no se realizan en base- N , sino en base- para algún La versión reflejada de la expansión beta es el mapa tent ; hay una variedad de otros mapas ergódicos del intervalo unitario. Moviéndonos a dos dimensiones, los billares aritméticos con ángulos irracionales son ergódicos. También se puede tomar un rectángulo plano, aplastarlo, cortarlo y volver a ensamblarlo; este es el mapa de Baker mencionado anteriormente . Sus puntos pueden describirse mediante el conjunto de cadenas bi-infinitas en dos letras, es decir, que se extienden tanto a la izquierda como a la derecha; como tal, parece dos copias del proceso de Bernoulli. Si uno se deforma lateralmente durante el aplastamiento, se obtiene el mapa del gato de Arnold . En la mayoría de los aspectos, el mapa del gato es prototípico de cualquier otra transformación similar. β {\displaystyle \beta } β . {\displaystyle \beta .}

En mecánica clásica y geometría

La ergodicidad es un fenómeno muy extendido en el estudio de las variedades simplécticas y las variedades riemannianas . Las variedades simplécticas proporcionan el marco generalizado para la mecánica clásica , donde el movimiento de un sistema mecánico se describe mediante una geodésica . Las variedades riemannianas son un caso especial: el fibrado cotangente de una variedad riemanniana es siempre una variedad simpléctica. En particular, las geodésicas de una variedad riemanniana se dan mediante la solución de las ecuaciones de Hamilton-Jacobi .

El flujo geodésico de un toro plano que sigue cualquier dirección irracional es ergódico; informalmente esto significa que al dibujar una línea recta en un cuadrado que comienza en cualquier punto y forma un ángulo irracional con respecto a los lados, si cada vez que se encuentra un lado se comienza de nuevo en el lado opuesto con el mismo ángulo, la línea eventualmente se encontrará con cada subconjunto de medida positiva. De manera más general, en cualquier superficie plana hay muchas direcciones ergódicas para el flujo geodésico.

En el caso de superficies no planas, se tiene que el flujo geodésico de cualquier superficie de Riemann compacta y negativamente curvada es ergódico. Una superficie es "compacta" en el sentido de que tiene un área superficial finita. El flujo geodésico es una generalización de la idea de moverse en una "línea recta" sobre una superficie curva: tales líneas rectas son geodésicas . Uno de los primeros casos estudiados es el billar de Hadamard , que describe geodésicas sobre la superficie de Bolza , topológicamente equivalente a una rosquilla con dos agujeros. La ergodicidad se puede demostrar de manera informal, si uno tiene un marcador y algún ejemplo razonable de una rosquilla con dos agujeros: comenzando en cualquier lugar, en cualquier dirección, uno intenta dibujar una línea recta; las reglas son útiles para esto. No se necesita mucho tiempo para descubrir que uno no está regresando al punto de partida. (Por supuesto, el dibujo torcido también puede explicar esto; es por eso que tenemos pruebas).

Estos resultados se extienden a dimensiones superiores. El flujo geodésico para variedades de Riemann compactas de curvatura negativa es ergódico. Un ejemplo clásico de esto es el flujo de Anosov , que es el flujo de horociclo en una variedad hiperbólica . Esto puede verse como una especie de fibración de Hopf . Tales flujos ocurren comúnmente en la mecánica clásica , que es el estudio en física de maquinaria móvil de dimensión finita, por ejemplo, el péndulo doble y demás. La mecánica clásica se construye sobre variedades simplécticas . Los flujos en tales sistemas pueden deconstruirse en variedades estables e inestables ; como regla general, cuando esto es posible, resulta un movimiento caótico. Que esto es genérico puede verse notando que el fibrado cotangente de una variedad de Riemann es (siempre) una variedad simpléctica; el flujo geodésico está dado por una solución a las ecuaciones de Hamilton-Jacobi para esta variedad. En términos de las coordenadas canónicas en la variedad cotangente, el hamiltoniano o energía está dado por ( q , p ) {\displaystyle (q,p)}

H = 1 2 i j g i j ( q ) p i p j {\displaystyle H={\tfrac {1}{2}}\sum _{ij}g^{ij}(q)p_{i}p_{j}}

con el tensor métrico (inverso) y el momento . La semejanza con la energía cinética de una partícula puntual no es casual; de ahí el sentido de llamar a estas cosas "energía". En este sentido, el comportamiento caótico con órbitas ergódicas es un fenómeno más o menos genérico en grandes áreas de la geometría. g i j {\displaystyle g^{ij}} p i {\displaystyle p_{i}} E = 1 2 m v 2 {\displaystyle E={\tfrac {1}{2}}mv^{2}}

Se han proporcionado resultados de ergodicidad en superficies de traslación , grupos hiperbólicos y geometría sistólica . Las técnicas incluyen el estudio de flujos ergódicos , la descomposición de Hopf y el teorema de Ambrose–Kakutani–Krengel–Kubo . Una clase importante de sistemas son los sistemas Axiom A.

Se han obtenido varios resultados de clasificación y "anticlasificación". El teorema de isomorfismo de Ornstein también se aplica aquí; nuevamente, establece que la mayoría de estos sistemas son isomorfos a algún esquema de Bernoulli . Esto vincula de manera bastante clara estos sistemas con la definición de ergodicidad dada para un proceso estocástico, en la sección anterior. Los resultados de anticlasificación establecen que hay más de un número infinito numerable de sistemas dinámicos ergódicos no equivalentes que preservan la medida. Esto quizás no sea del todo una sorpresa, ya que se pueden usar puntos en el conjunto de Cantor para construir sistemas similares pero diferentes. Consulte el sistema dinámico que preserva la medida para obtener un breve resumen de algunos de los resultados de anticlasificación.

En mecánica ondulatoria

En todas las secciones anteriores se ha considerado la ergodictia desde el punto de vista de un sistema dinámico medible o desde la noción dual de seguimiento del movimiento de trayectorias de partículas individuales. Un concepto estrechamente relacionado se da en la mecánica ondulatoria (no lineal) . Allí, la interacción resonante permite la mezcla de modos normales , lo que a menudo (pero no siempre) conduce a la termalización final del sistema. Uno de los primeros sistemas que se estudió rigurosamente en este contexto es el problema de Fermi–Pasta–Ulam–Tsingou , una cadena de osciladores débilmente acoplados.

Una interacción resonante es posible siempre que las relaciones de dispersión de los medios ondulatorios permitan que tres o más modos normales se sumen de tal manera que se conserven tanto el momento total como la energía total. Esto permite que la energía concentrada en un modo se filtre a otros modos, distribuyendo finalmente esa energía de manera uniforme entre todos los modos que interactúan.

Las interacciones resonantes entre ondas ayudan a comprender la distinción entre el caos de alta dimensión (es decir, la turbulencia ) y la termalización. Cuando los modos normales se pueden combinar de modo que la energía y el momento se conserven exactamente, entonces se aplica la teoría de las interacciones resonantes y la energía se propaga a todos los modos que interactúan. Cuando las relaciones de dispersión solo permiten un equilibrio aproximado, se produce turbulencia o movimiento caótico. Los modos turbulentos pueden entonces transferir energía a modos que sí se mezclan, lo que finalmente conduce a la termalización, pero no antes de un intervalo previo de movimiento caótico.

En mecánica cuántica

En cuanto a la mecánica cuántica, no existe una definición cuántica universal de ergodicidad o incluso de caos (véase caos cuántico ). [7] Sin embargo, existe un teorema de ergodicidad cuántica que establece que el valor esperado de un operador converge al promedio clásico microcanónico correspondiente en el límite semiclásico . No obstante, el teorema no implica que todos los estados propios del hamiltoniano cuya contraparte clásica es caótica sean características y aleatorios. Por ejemplo, el teorema de ergodicidad cuántica no excluye la existencia de estados no ergódicos como las cicatrices cuánticas . Además de las cicatrices convencionales, [8] [9] [10] [11] existen otros dos tipos de cicatrices cuánticas, que ilustran aún más la ruptura de la ergodicidad débil en sistemas caóticos cuánticos: cicatrices cuánticas inducidas por perturbación [12] [13] [14] [15] [16] y cicatrices cuánticas de muchos cuerpos. [17] 0 {\displaystyle \hbar \rightarrow 0}

Definición para sistemas de tiempo discreto

Las medidas ergódicas constituyen uno de los pilares sobre los que se suele hablar de ergodicidad. A continuación se ofrece una definición formal.

Medida invariante

Sea un espacio medible . Si es una función medible de a sí misma y una medida de probabilidad en , entonces un sistema dinámico que preserva la medida se define como un sistema dinámico para el cual para todo . Se dice que un sistema de este tipo preserva de manera equivalente, es decir , invariante . ( X , B ) {\displaystyle (X,{\mathcal {B}})} T {\displaystyle T} X {\displaystyle X} μ {\displaystyle \mu } ( X , B ) {\displaystyle (X,{\mathcal {B}})} μ ( T 1 ( A ) ) = μ ( A ) {\displaystyle \mu {\mathord {\left(T^{-1}(A)\right)}}=\mu (A)} A B {\displaystyle A\in {\mathcal {B}}} T {\displaystyle T} μ ; {\displaystyle \mu ;} μ {\displaystyle \mu } T {\displaystyle T}

Medida ergódica

Se dice que una función medible es -ergódica o que es una medida ergódica si se conserva y se cumple la siguiente condición: T {\displaystyle T} μ {\displaystyle \mu } μ {\displaystyle \mu } T {\displaystyle T} T {\displaystyle T} μ {\displaystyle \mu }

Para cualquier tal que o . A B {\displaystyle A\in {\mathcal {B}}} T 1 ( A ) = A {\displaystyle T^{-1}(A)=A} μ ( A ) = 0 {\displaystyle \mu (A)=0} μ ( A ) = 1 {\displaystyle \mu (A)=1}

En otras palabras, no hay subconjuntos -invariantes hasta la medida 0 (con respecto a ). T {\displaystyle T} μ {\displaystyle \mu }

Algunos autores [18] relajan el requisito de que se preserve al requisito de que sea una transformación no singular con respecto a , lo que significa que si es un subconjunto tal que tiene medida cero, entonces también la tiene . T {\displaystyle T} μ {\displaystyle \mu } T {\displaystyle T} μ {\displaystyle \mu } N {\displaystyle N} T 1 ( N ) {\displaystyle T^{-1}(N)} T ( N ) {\displaystyle T(N)}

Ejemplos

El ejemplo más simple es cuando es un conjunto finito y la medida de conteo . Entonces, una autoaplicación de se conserva si y solo si es una biyección, y es ergódico si y solo si tiene una sola órbita (es decir, para cada existe tal que ). Por ejemplo, si entonces el ciclo es ergódico, pero la permutación no lo es (tiene los dos subconjuntos invariantes y ). X {\displaystyle X} μ {\displaystyle \mu } X {\displaystyle X} μ {\displaystyle \mu } T {\displaystyle T} x , y X {\displaystyle x,y\in X} k N {\displaystyle k\in \mathbb {N} } y = T k ( x ) {\displaystyle y=T^{k}(x)} X = { 1 , 2 , , n } {\displaystyle X=\{1,2,\ldots ,n\}} ( 1 2 n ) {\displaystyle (1\,2\,\cdots \,n)} ( 1 2 ) ( 3 4 n ) {\displaystyle (1\,2)(3\,4\,\cdots \,n)} { 1 , 2 } {\displaystyle \{1,2\}} { 3 , 4 , , n } {\displaystyle \{3,4,\ldots ,n\}}

Formulaciones equivalentes

La definición dada anteriormente admite las siguientes reformulaciones inmediatas:

  • para cada con tenemos o (donde denota la diferencia simétrica ); A B {\displaystyle A\in {\mathcal {B}}} μ ( T 1 ( A ) A ) = 0 {\displaystyle \mu {\mathord {\left(T^{-1}(A)\bigtriangleup A\right)}}=0} μ ( A ) = 0 {\displaystyle \mu (A)=0} μ ( A ) = 1 {\displaystyle \mu (A)=1\,} {\displaystyle \bigtriangleup }
  • por cada medida positiva que tengamos ; A B {\displaystyle A\in {\mathcal {B}}} μ ( n = 1 T n ( A ) ) = 1 {\textstyle \mu {\mathord {\left(\bigcup _{n=1}^{\infty }T^{-n}(A)\right)}}=1}
  • para cada dos conjuntos de medidas positivas, existe tal que ; A , B B {\displaystyle A,B\in {\mathcal {B}}} n > 0 {\displaystyle n>0} μ ( ( T n ( A ) ) B ) > 0 {\displaystyle \mu {\mathord {\left(\left(T^{-n}(A)\right)\cap B\right)}}>0}
  • Toda función medible con es constante en un subconjunto de medida completa. f : X R {\displaystyle f:X\to \mathbb {R} } f T = f {\displaystyle f\circ T=f}

Es importante para las aplicaciones que la condición en la última caracterización se pueda restringir únicamente a funciones integrables al cuadrado :

  • Si y entonces es constante casi en todas partes. f L 2 ( X , μ ) {\displaystyle f\in L^{2}(X,\mu )} f T = f {\displaystyle f\circ T=f} f {\displaystyle f}

Más ejemplos

Desplazamientos y subdesplazamientos de Bernoulli

Sea un conjunto finito y con la medida del producto (cada factor está dotado de su medida de conteo). Entonces el operador de desplazamiento definido por es -ergódico . [19] S {\displaystyle S} X = S Z {\displaystyle X=S^{\mathbb {Z} }} μ {\displaystyle \mu } S {\displaystyle S} T {\displaystyle T} T ( ( s k ) k Z ) ) = ( s k + 1 ) k Z {\displaystyle T\left((s_{k})_{k\in \mathbb {Z} })\right)=(s_{k+1})_{k\in \mathbb {Z} }} μ {\displaystyle \mu }

Hay muchas más medidas ergódicas para el mapa de desplazamientos en . Las secuencias periódicas dan medidas con un soporte finito. Más interesante aún, hay otras con un soporte infinito que son subdesplazamientos de tipo finito . T {\displaystyle T} X {\displaystyle X}

Rotaciones irracionales

Sea el círculo unitario , con su medida de Lebesgue . Para cualquier rotación de un ángulo está dada por . Si entonces no es ergódico para la medida de Lebesgue ya que tiene infinitas órbitas finitas. Por otro lado, si es irracional entonces es ergódico. [20] X {\displaystyle X} { z C , | z | = 1 } {\displaystyle \{z\in \mathbb {C} ,\,|z|=1\}} μ {\displaystyle \mu } θ R {\displaystyle \theta \in \mathbb {R} } X {\displaystyle X} θ {\displaystyle \theta } T θ ( z ) = e 2 i π θ z {\displaystyle T_{\theta }(z)=e^{2i\pi \theta }z} θ Q {\displaystyle \theta \in \mathbb {Q} } T θ {\displaystyle T_{\theta }} θ {\displaystyle \theta } T θ {\displaystyle T_{\theta }}

Mapa del gato de Arnold

Sea el 2-toro. Entonces cualquier elemento define un autoaplicativo de ya que . Cuando se obtiene el llamado mapa del gato de Arnold, que es ergódico para la medida de Lebesgue en el toro. X = R 2 / Z 2 {\displaystyle X=\mathbb {R} ^{2}/\mathbb {Z} ^{2}} g S L 2 ( Z ) {\displaystyle g\in \mathrm {SL} _{2}(\mathbb {Z} )} X {\displaystyle X} g ( Z 2 ) = Z 2 {\displaystyle g\left(\mathbb {Z} ^{2}\right)=\mathbb {Z} ^{2}} g = ( 2 1 1 1 ) {\textstyle g=\left({\begin{array}{cc}2&1\\1&1\end{array}}\right)}

Teoremas ergódicos

Si es una medida de probabilidad en un espacio que es ergódico para una transformación, el teorema ergódico puntual de G. Birkhoff establece que para cada función medible y para casi cada punto, el promedio temporal en la órbita de converge al promedio espacial de . Formalmente, esto significa que μ {\displaystyle \mu } X {\displaystyle X} T {\displaystyle T} f : X R {\displaystyle f:X\to \mathbb {R} } μ {\displaystyle \mu } x X {\displaystyle x\in X} x {\displaystyle x} f {\displaystyle f} lim k + ( 1 k + 1 i = 0 k f ( T i ( x ) ) ) = X f d μ . {\displaystyle \lim _{k\to +\infty }\left({\frac {1}{k+1}}\sum _{i=0}^{k}f\left(T^{i}(x)\right)\right)=\int _{X}fd\mu .}

El teorema ergódico medio de J. von Neumann es una afirmación similar, más débil, sobre las traslaciones promedio de funciones integrables al cuadrado.

Órbitas densas

Una consecuencia inmediata de la definición de ergodicidad es que en un espacio topológico , y si es la σ-álgebra de conjuntos de Borel , si es -ergódico entonces -casi cada órbita de es densa en el soporte de . X {\displaystyle X} B {\displaystyle {\mathcal {B}}} T {\displaystyle T} μ {\displaystyle \mu } μ {\displaystyle \mu } T {\displaystyle T} μ {\displaystyle \mu }

Esto no es una equivalencia ya que para una transformación que no es únicamente ergódica, pero para la cual existe una medida ergódica con soporte completo , para cualquier otra medida ergódica la medida no es ergódica para pero sus órbitas son densas en el soporte. Se pueden construir ejemplos explícitos con medidas invariantes al desplazamiento. [21] μ 0 {\displaystyle \mu _{0}} μ 1 {\displaystyle \mu _{1}} 1 2 ( μ 0 + μ 1 ) {\textstyle {\frac {1}{2}}(\mu _{0}+\mu _{1})} T {\displaystyle T}

Mezclando

Se dice que una transformación de un espacio de medida de probabilidad es mixta para la medida si para cualquier conjunto medible se cumple lo siguiente: T {\displaystyle T} ( X , μ ) {\displaystyle (X,\mu )} μ {\displaystyle \mu } A , B X {\displaystyle A,B\subset X} lim n + μ ( T n A B ) = μ ( A ) μ ( B ) {\displaystyle \lim _{n\to +\infty }\mu \left(T^{-n}A\cap B\right)=\mu (A)\mu (B)}

Es evidente que una transformación de mezcla también es ergódica (considerando un subconjunto -estable y su complemento). Lo inverso no es cierto, por ejemplo, una rotación con un ángulo irracional en el círculo (que es ergódica según los ejemplos anteriores) no es de mezcla (para un intervalo suficientemente pequeño sus imágenes sucesivas no se intersectarán la mayor parte del tiempo). Los desplazamientos de Bernoulli son de mezcla, y también lo es el mapa del gato de Arnold. A {\displaystyle A} T {\displaystyle T} B {\displaystyle B}

Esta noción de mezcla a veces se denomina mezcla fuerte, en oposición a mezcla débil, que significa que lim n + 1 n k = 1 n | μ ( T n A B ) μ ( A ) μ ( B ) | = 0 {\displaystyle \lim _{n\to +\infty }{\frac {1}{n}}\sum _{k=1}^{n}\left|\mu (T^{-n}A\cap B)-\mu (A)\mu (B)\right|=0}

Ergodicidad adecuada

Se dice que la transformación es propiamente ergódica si no tiene una órbita de medida completa. En el caso discreto esto significa que la medida no se apoya en una órbita finita de . T {\displaystyle T} μ {\displaystyle \mu } T {\displaystyle T}

Definición para sistemas dinámicos de tiempo continuo

La definición es esencialmente la misma para sistemas dinámicos de tiempo continuo que para una única transformación. Sea un espacio medible y para cada , entonces dicho sistema está dado por una familia de funciones mensurables de a sí mismo, de modo que para cualquier la relación se cumple (normalmente también se pregunta que la función de órbita de también sea medible). Si es una medida de probabilidad en entonces decimos que es -ergódico o es una medida ergódica para si cada uno se conserva y se cumple la siguiente condición: ( X , B ) {\displaystyle (X,{\mathcal {B}})} t R + {\displaystyle t\in \mathbb {R} _{+}} T t {\displaystyle T_{t}} X {\displaystyle X} t , s R + {\displaystyle t,s\in \mathbb {R} _{+}} T s + t = T s T t {\displaystyle T_{s+t}=T_{s}\circ T_{t}} R + × X X {\displaystyle \mathbb {R} _{+}\times X\to X} μ {\displaystyle \mu } ( X , B ) {\displaystyle (X,{\mathcal {B}})} T t {\displaystyle T_{t}} μ {\displaystyle \mu } μ {\displaystyle \mu } T {\displaystyle T} T t {\displaystyle T_{t}} μ {\displaystyle \mu }

Para cualquier , si para todos tenemos entonces o bien . A B {\displaystyle A\in {\mathcal {B}}} t R + {\displaystyle t\in \mathbb {R} _{+}} T t 1 ( A ) A {\displaystyle T_{t}^{-1}(A)\subset A} μ ( A ) = 0 {\displaystyle \mu (A)=0} μ ( A ) = 1 {\displaystyle \mu (A)=1}

Ejemplos

Como en el caso discreto el ejemplo más simple es el de una acción transitiva, por ejemplo la acción sobre el círculo dada por es ergódica para la medida de Lebesgue. T t ( z ) = e 2 i π t z {\displaystyle T_{t}(z)=e^{2i\pi t}z}

Un ejemplo con infinitas órbitas lo da el flujo a lo largo de una pendiente irracional en el toro: sea y . Sea ; entonces si esto es ergódico para la medida de Lebesgue. X = S 1 × S 1 {\displaystyle X=\mathbb {S} ^{1}\times \mathbb {S} ^{1}} α R {\displaystyle \alpha \in \mathbb {R} } T t ( z 1 , z 2 ) = ( e 2 i π t z 1 , e 2 α i π t z 2 ) {\displaystyle T_{t}(z_{1},z_{2})=\left(e^{2i\pi t}z_{1},e^{2\alpha i\pi t}z_{2}\right)} α Q {\displaystyle \alpha \not \in \mathbb {Q} }

Flujos ergódicos

Otros ejemplos de flujos ergódicos son:

Ergodicidad en espacios métricos compactos

Si es un espacio métrico compacto , está naturalmente dotado de la σ-álgebra de conjuntos de Borel . La estructura adicional que proviene de la topología permite entonces una teoría mucho más detallada para las transformaciones ergódicas y las medidas en . X {\displaystyle X} X {\displaystyle X}

Interpretación del análisis funcional

Se puede dar una definición alternativa muy potente de las medidas ergódicas utilizando la teoría de los espacios de Banach . Las medidas de Radon en forman un espacio de Banach del que el conjunto de medidas de probabilidad en es un subconjunto convexo . Dada una transformación continua del subconjunto de medidas -invariantes es un subconjunto convexo cerrado, y una medida es ergódica para si y solo si es un punto extremo de este convexo. [22] X {\displaystyle X} P ( X ) {\displaystyle {\mathcal {P}}(X)} X {\displaystyle X} T {\displaystyle T} X {\displaystyle X} P ( X ) T {\displaystyle {\mathcal {P}}(X)^{T}} T {\displaystyle T} T {\displaystyle T}

Existencia de medidas ergódicas

En el contexto anterior se deduce del teorema de Banach-Alaoglu que siempre existen puntos extremos en . Por lo tanto, una transformación de un espacio métrico compacto siempre admite medidas ergódicas. P ( X ) T {\displaystyle {\mathcal {P}}(X)^{T}}

Descomposición ergódica

En general, una medida invariante no tiene por qué ser ergódica, pero como consecuencia de la teoría de Choquet siempre se puede expresar como el baricentro de una medida de probabilidad en el conjunto de medidas ergódicas. Esto se conoce como descomposición ergódica de la medida. [23]

Ejemplo

En el caso de y la medida de conteo no es ergódica. Las medidas ergódicas para son las medidas uniformes soportadas en los subconjuntos y y cada medida de probabilidad invariante puede escribirse en la forma para algún . En particular, es la descomposición ergódica de la medida de conteo. X = { 1 , , n } {\displaystyle X=\{1,\ldots ,n\}} T = ( 1 2 ) ( 3 4 n ) {\displaystyle T=(1\,2)(3\,4\,\cdots \,n)} T {\displaystyle T} μ 1 , μ 2 {\displaystyle \mu _{1},\mu _{2}} { 1 , 2 } {\displaystyle \{1,2\}} { 3 , , n } {\displaystyle \{3,\ldots ,n\}} T {\displaystyle T} t μ 1 + ( 1 t ) μ 2 {\displaystyle t\mu _{1}+(1-t)\mu _{2}} t [ 0 , 1 ] {\displaystyle t\in [0,1]} 2 n μ 1 + n 2 n μ 2 {\textstyle {\frac {2}{n}}\mu _{1}+{\frac {n-2}{n}}\mu _{2}}

Sistemas continuos

Todo lo que aparece en esta sección se transfiere textualmente a acciones continuas de o sobre espacios métricos compactos. R {\displaystyle \mathbb {R} } R + {\displaystyle \mathbb {R} _{+}}

Ergodicidad única

Se dice que la transformación es únicamente ergódica si existe una medida de probabilidad de Borel única en la que es ergódica para . T {\displaystyle T} μ {\displaystyle \mu } X {\displaystyle X} T {\displaystyle T}

En los ejemplos considerados anteriormente, las rotaciones irracionales del círculo son únicamente ergódicas; [24] los mapas de desplazamiento no lo son.

Interpretación probabilística: procesos ergódicos

Si es un proceso estocástico de tiempo discreto en un espacio , se dice que es ergódico si la distribución conjunta de las variables en es invariante bajo el mapa de desplazamiento . Este es un caso particular de las nociones analizadas anteriormente. ( X n ) n 1 {\displaystyle \left(X_{n}\right)_{n\geq 1}} Ω {\displaystyle \Omega } Ω N {\displaystyle \Omega ^{\mathbb {N} }} ( x n ) n 1 ( x n + 1 ) n 1 {\displaystyle \left(x_{n}\right)_{n\geq 1}\mapsto \left(x_{n+1}\right)_{n\geq 1}}

El caso más simple es el de un proceso independiente e idénticamente distribuido que corresponde al mapa de desplazamientos descrito anteriormente. Otro caso importante es el de una cadena de Markov que se analiza en detalle a continuación.

Una interpretación similar se aplica a los procesos estocásticos de tiempo continuo, aunque la construcción de la estructura medible de la acción es más complicada.

Ergodicidad de las cadenas de Markov

El sistema dinámico asociado a una cadena de Markov

Sea un conjunto finito. Una cadena de Markov en se define por una matriz , donde es la probabilidad de transición de a , por lo que para cada tenemos . Una medida estacionaria para es una medida de probabilidad en tal que  ; es decir, para todo . S {\displaystyle S} S {\displaystyle S} P [ 0 , 1 ] S × S {\displaystyle P\in [0,1]^{S\times S}} P ( s 1 , s 2 ) {\displaystyle P(s_{1},s_{2})} s 1 {\displaystyle s_{1}} s 2 {\displaystyle s_{2}} s S {\displaystyle s\in S} s S P ( s , s ) = 1 {\textstyle \sum _{s'\in S}P(s,s')=1} P {\displaystyle P} ν {\displaystyle \nu } S {\displaystyle S} ν P = ν {\displaystyle \nu P=\nu } s S ν ( s ) P ( s , s ) = ν ( s ) {\textstyle \sum _{s'\in S}\nu (s')P(s',s)=\nu (s)} s S {\displaystyle s\in S}

Utilizando estos datos podemos definir una medida de probabilidad en el conjunto con su producto σ-álgebra dando las medidas de los cilindros de la siguiente manera: μ ν {\displaystyle \mu _{\nu }} X = S Z {\displaystyle X=S^{\mathbb {Z} }} μ ν ( × S × { ( s n , , s m ) } × S × ) = ν ( s n ) P ( s n , s n + 1 ) P ( s m 1 , s m ) . {\displaystyle \mu _{\nu }(\cdots \times S\times \{(s_{n},\ldots ,s_{m})\}\times S\times \cdots )=\nu (s_{n})P(s_{n},s_{n+1})\cdots P(s_{m-1},s_{m}).}

La estacionariedad de entonces significa que la medida es invariante bajo el mapa de desplazamiento . ν {\displaystyle \nu } μ ν {\displaystyle \mu _{\nu }} T ( ( s k ) k Z ) ) = ( s k + 1 ) k Z {\displaystyle T\left(\left(s_{k}\right)_{k\in \mathbb {Z} })\right)=\left(s_{k+1}\right)_{k\in \mathbb {Z} }}

Criterio de ergodicidad

La medida es siempre ergódica para el mapa de desplazamiento si la cadena de Markov asociada es irreducible (cualquier estado puede alcanzarse con probabilidad positiva desde cualquier otro estado en un número finito de pasos). [25] μ ν {\displaystyle \mu _{\nu }}

Las hipótesis anteriores implican que existe una medida estacionaria única para la cadena de Markov. En términos de la matriz, una condición suficiente para esto es que 1 sea un valor propio simple de la matriz y que todos los demás valores propios de (en ) tengan módulo <1. P {\displaystyle P} P {\displaystyle P} P {\displaystyle P} C {\displaystyle \mathbb {C} }

Nótese que en teoría de probabilidad la cadena de Markov se llama ergódica si además cada estado es aperiódico (los momentos en los que la probabilidad de retorno es positiva no son múltiplos de un único entero >1). Esto no es necesario para que la medida invariante sea ergódica; por lo tanto, las nociones de "ergodicidad" para una cadena de Markov y la medida invariante al desplazamiento asociada son diferentes (la de la cadena es estrictamente más fuerte). [26]

Además, el criterio es un "si y sólo si" si todas las clases comunicantes en la cadena son recurrentes y consideramos todas las medidas estacionarias.

Ejemplos

Medida de conteo

Si para todos , entonces la medida estacionaria es la medida de conteo, la medida es el producto de las medidas de conteo. La cadena de Markov es ergódica, por lo que el ejemplo de desplazamiento anterior es un caso especial del criterio. P ( s , s ) = 1 / | S | {\displaystyle P(s,s')=1/|S|} s , s S {\displaystyle s,s'\in S} μ P {\displaystyle \mu _{P}}

Cadenas de Markov no ergódicas

Las cadenas de Markov con clases recurrentes comunicantes que no son irreducibles no son ergódicas, y esto se puede ver inmediatamente de la siguiente manera. Si son dos clases recurrentes comunicantes distintas, hay medidas estacionarias distintas de cero admitidas en y respectivamente, los subconjuntos y son ambos invariantes al desplazamiento y de medida 1/2 para la medida de probabilidad invariante . Un ejemplo muy simple de eso es la cadena en dada por la matriz (ambos estados son estacionarios). S 1 , S 2 S {\displaystyle S_{1},S_{2}\subsetneq S} ν 1 , ν 2 {\displaystyle \nu _{1},\nu _{2}} S 1 , S 2 {\displaystyle S_{1},S_{2}} S 1 Z {\displaystyle S_{1}^{\mathbb {Z} }} S 2 Z {\displaystyle S_{2}^{\mathbb {Z} }} 1 2 ( ν 1 + ν 2 ) {\textstyle {\frac {1}{2}}(\nu _{1}+\nu _{2})} S = { 1 , 2 } {\displaystyle S=\{1,2\}} ( 1 0 0 1 ) {\textstyle \left({\begin{array}{cc}1&0\\0&1\end{array}}\right)}

Una cadena periódica

La cadena de Markov dada por la matriz es irreducible pero periódica. Por lo tanto, no es ergódica en el sentido de cadena de Markov, aunque la medida asociada en es ergódica para el mapa de desplazamiento. Sin embargo, el desplazamiento no es mixto para esta medida, como para los conjuntos. S = { 1 , 2 } {\displaystyle S=\{1,2\}} ( 0 1 1 0 ) {\textstyle \left({\begin{array}{cc}0&1\\1&0\end{array}}\right)} μ {\displaystyle \mu } { 1 , 2 } Z {\displaystyle \{1,2\}^{\mathbb {Z} }} A = × { 1 , 2 } × 1 × { 1 , 2 } × 1 × { 1 , 2 } {\displaystyle A=\cdots \times \{1,2\}\times 1\times \{1,2\}\times 1\times \{1,2\}\cdots }

y B = × { 1 , 2 } × 2 × { 1 , 2 } × 2 × { 1 , 2 } {\displaystyle B=\cdots \times \{1,2\}\times 2\times \{1,2\}\times 2\times \{1,2\}\cdots }

tenemos pero μ ( A ) = 1 2 = μ ( B ) {\textstyle \mu (A)={\frac {1}{2}}=\mu (B)} μ ( T n A B ) = { 1 2  if  n  is odd 0  if  n  is even. {\displaystyle \mu \left(T^{-n}A\cap B\right)={\begin{cases}{\frac {1}{2}}{\text{ if }}n{\text{ is odd}}\\0{\text{ if }}n{\text{ is even.}}\end{cases}}}

Generalizaciones

La definición de ergodicidad también tiene sentido para las acciones grupales . La teoría clásica (para transformaciones invertibles) corresponde a acciones de o . Z {\displaystyle \mathbb {Z} } R {\displaystyle \mathbb {R} }

Para los grupos no abelianos puede que no haya medidas invariantes ni siquiera en espacios métricos compactos. Sin embargo, la definición de ergodicidad se mantiene sin cambios si se reemplazan las medidas invariantes por medidas cuasi-invariantes .

Ejemplos importantes son la acción de un grupo de Lie semisimple (o una red dentro del mismo) sobre su límite de Furstenberg .

Una relación de equivalencia medible se dice que es ergódica si todos los subconjuntos saturados son nulos o nulos.

Notas

  1. ^ Schöpf, H.‐G. (Enero de 1970). "<scp>VI Arnold</scp> y<scp> A. Avez</scp>, Problemas ergódicos de la mecánica clásica. (Serie de monografías de física matemática) IX + 286 S. m. Fig. Nueva York/Amsterdam 1968. WA Benjamin, Inc. Preis geb. $ 14,75, brosch $ 6,95 ". ZAMM - Revista de Mecánica y Matemáticas Aplicadas / Zeitschrift für Angewandte Mathematik und Mechanik . 50 (7–9): 506–506. doi :10.1002/zamm.19700500721. ISSN  0044-2267.
  2. ^ Achim Klenke, "Teoría de la probabilidad: un curso completo" (2013) Springer Universitext ISBN 978-1-4471-5360-3 DOI 10.1007/978-1-4471-5361-0 ( Ver Capítulo Uno )
  3. ^ Walters 1982, §0.1, pág. 2
  4. ^ Gallavotti, Giovanni (1995). "Ergodicidad, conjuntos, irreversibilidad en Boltzmann y más allá". Journal of Statistical Physics . 78 (5–6): 1571–1589. arXiv : chao-dyn/9403004 . Código Bibliográfico :1995JSP....78.1571G. doi :10.1007/BF02180143. S2CID  17605281.
  5. ^ Feller, William (1 de agosto de 2008). Introducción a la teoría de la probabilidad y sus aplicaciones (2.ª ed.). Wiley India Pvt. Limited. pág. 271. ISBN 978-81-265-1806-7.
  6. ^ Plancherel, M. (1913). "Beweis der Unmöglichkeit ergodischer mechanischer Systeme". Annalen der Physik . 42 : 1061-1063. doi : 10.1002/andp.19133471509.
  7. ^ Stöckmann, Hans-Jürgen (1999). Caos cuántico: una introducción. Cambridge: Cambridge University Press. doi :10.1017/cbo9780511524622. ISBN 978-0-521-02715-1.
  8. ^ Heller, Eric J. (15 de octubre de 1984). "Funciones propias de estado ligado de sistemas hamiltonianos clásicamente caóticos: cicatrices de órbitas periódicas". Physical Review Letters . 53 (16): 1515–1518. Código Bibliográfico :1984PhRvL..53.1515H. doi :10.1103/PhysRevLett.53.1515.
  9. ^ Kaplan, L (1999-03-01). "Cicatrices en funciones de onda caóticas cuánticas". No linealidad . 12 (2): R1–R40. doi :10.1088/0951-7715/12/2/009. ISSN  0951-7715. S2CID  250793219.
  10. ^ Kaplan, L.; Heller, EJ (abril de 1998). "Teoría lineal y no lineal de cicatrices de funciones propias". Anales de Física . 264 (2): 171–206. arXiv : chao-dyn/9809011 . Código Bibliográfico :1998AnPhy.264..171K. doi :10.1006/aphy.1997.5773. S2CID  120635994.
  11. ^ Heller, Eric Johnson (2018). La vía semiclásica hacia la dinámica y la espectroscopia. Princeton: Princeton University Press. ISBN 978-1-4008-9029-3.OCLC 1034625177  .
  12. ^ Keski-Rahkonen, J.; Ruhanen, A.; Heller, EJ; Räsänen, E. (21 de noviembre de 2019). "Cicatrices cuánticas de Lissajous". Cartas de revisión física . 123 (21): 214101. arXiv : 1911.09729 . Código bibliográfico : 2019PhRvL.123u4101K. doi :10.1103/PhysRevLett.123.214101. PMID  31809168. S2CID  208248295.
  13. ^ Luukko, Perttu JJ; Drury, Byron; Klales, Anna; Kaplan, Lev; Heller, Eric J.; Räsänen, Esa (28 de noviembre de 2016). "Fuertes cicatrices cuánticas por impurezas locales". Informes científicos . 6 (1): 37656. arXiv : 1511.04198 . Código Bib : 2016NatSR...637656L. doi :10.1038/srep37656. ISSN  2045-2322. PMC 5124902 . PMID  27892510. 
  14. ^ Keski-Rahkonen, J.; Luukko, PJJ; Kaplan, L.; Heller, EJ; Räsänen, E. (20 de septiembre de 2017). "Cicatrices cuánticas controlables en puntos cuánticos de semiconductores". Revisión física B. 96 (9): 094204. arXiv : 1710.00585 . Código Bib : 2017PhRvB..96i4204K. doi : 10.1103/PhysRevB.96.094204. S2CID  119083672.
  15. ^ Keski-Rahkonen, J; Luukko, PJJ; Åberg, S; Räsänen, E (21 de enero de 2019). "Efectos de las cicatrices sobre el caos cuántico en pozos cuánticos desordenados". Revista de Física: Materia Condensada . 31 (10): 105301. arXiv : 1806.02598 . Código Bib : 2019JPCM...31j5301K. doi :10.1088/1361-648x/aaf9fb. ISSN  0953-8984. PMID  30566927. S2CID  51693305.
  16. ^ Keski-Rahkonen, Joonas (2020). Caos cuántico en nanoestructuras bidimensionales desordenadas. Universidad de Tampere. ISBN 978-952-03-1699-0.
  17. ^ Turner, CJ; Michailidis, AA; Abanin, DA; Serbyn, M.; Papić, Z. (julio de 2018). "Ruptura de ergodicidad débil a partir de cicatrices cuánticas de muchos cuerpos". Nature Physics . 14 (7): 745–749. arXiv : 1711.03528 . Código Bibliográfico :2018NatPh..14..745T. doi :10.1038/s41567-018-0137-5. ISSN  1745-2481. S2CID  256706206.
  18. ^ Aaronson, Jon (1997). Introducción a la teoría ergódica infinita . Encuestas y monografías matemáticas. Vol. 50. Providence, Rhode Island: American Mathematical Society. p. 21. doi :10.1090/surv/050. ISBN. 0-8218-0494-4.Señor 1450400  .
  19. ^ Walters 1982, pág. 32.
  20. ^ Walters 1982, pág. 29.
  21. ^ "Ejemplo de un sistema que preserva la medida con órbitas densas que no es ergódico". MathOverflow . 1 de septiembre de 2011 . Consultado el 16 de mayo de 2020 .
  22. ^ Walters 1982, pág. 152.
  23. ^ Walters 1982, pág. 153.
  24. ^ Walters 1982, pág. 159.
  25. ^ Walters 1982, pág. 42.
  26. ^ «Diferentes usos de la palabra «ergódico»». MathOverflow . 4 de septiembre de 2011 . Consultado el 16 de mayo de 2020 .

Referencias

  • Walters, Peter (1982). Introducción a la teoría ergódica . Springer . ISBN. 0-387-95152-0.
  • Brin, Michael; Garrett, Stuck (2002). Introducción a los sistemas dinámicos . Cambridge University Press. ISBN 0-521-80841-3.
  • Karma Dajani y Sjoerd Dirksin, "Una introducción sencilla a la teoría ergódica"
Retrieved from "https://en.wikipedia.org/w/index.php?title=Ergodicity&oldid=1246273880"