Si es un proceso ergódico estacionario , entonces converge casi con seguridad a El teorema de Glivenko-Cantelli proporciona un modo de convergencia más fuerte que este en el caso iid .
Para simplificar, considere un caso de variable aleatoria continua . Fije de modo que para . Ahora, para todos existe tal que .
Por lo tanto,
Dado que, por la ley fuerte de los grandes números, podemos garantizar que para cualquier número entero positivo y cualquier número entero tal que , podemos encontrar tal que para todo , tenemos . Combinado con el resultado anterior, esto implica además que , que es la definición de convergencia casi segura.
Medidas empíricas
Se puede generalizar la función de distribución empírica reemplazando el conjunto por un conjunto arbitrario C de una clase de conjuntos para obtener una medida empírica indexada por conjuntos.
donde es la medida empírica, es el mapa correspondiente, y
suponiendo que exista.
Definiciones
Una clase se denomina clase Glivenko-Cantelli (o clase GC , o a veces clase GC fuerte ) con respecto a una medida de probabilidad P si
casi seguro como
Una clase es una clase Glivenko-Cantelli débil con respecto a P si, en cambio, satisface la condición más débil
en probabilidad como
Una clase se denomina clase universal Glivenko-Cantelli si es una clase GC con respecto a cualquier medida de probabilidad en .
Una clase es una clase Glivenko-Cantelli uniforme débil si la convergencia ocurre uniformemente sobre todas las medidas de probabilidad en : Para cada ,
como
Una clase es una clase Glivenko-Cantelli uniforme (fuerte) si satisface la condición más fuerte de que para cada ,
como
Las clases de funciones de Glivenko-Cantelli (así como sus formas uniformes y universales) se definen de manera similar, reemplazando todas las instancias de con .
Las versiones débiles y fuertes de las diversas propiedades de Glivenko-Cantelli suelen coincidir en determinadas condiciones de regularidad. La siguiente definición suele aparecer en tales condiciones de regularidad:
Una clase de funciones es Suslin admisible en imágenes si existe un espacio de Suslin y una sobreyección tales que la función es medible .
Una clase de conjuntos mensurables es Suslin admisible en imágenes si la clase de funciones es Suslin admisible en imágenes, donde denota la función indicadora para el conjunto .
Teoremas
Los dos teoremas siguientes proporcionan condiciones suficientes para que las versiones débil y fuerte de la propiedad de Glivenko-Cantelli sean equivalentes.
Supongamos que una clase de función está acotada. Supongamos también que el conjunto es Suslin admisible en imágenes. Entonces es una clase Glivenko-Cantelli uniforme débil si y solo si es una clase Glivenko-Cantelli uniforme fuerte.
El siguiente teorema es fundamental para el aprendizaje estadístico de las tareas de clasificación binaria.
Bajo ciertas condiciones de consistencia, una clase universalmente medible de conjuntos es una clase Glivenko-Cantelli uniforme si y sólo si es una clase Vapnik-Chervonenkis .
Existen diversas condiciones de consistencia para la equivalencia de clases uniformes de Glivenko-Cantelli y Vapnik-Chervonenkis. En particular, cualquiera de las siguientes condiciones para una clase es suficiente: [9]
Es una imagen admisible de Suslin.
es universalmente separable : existe un subconjunto contable de tal que cada conjunto puede escribirse como el límite puntual de conjuntos en .
Ejemplos
Sea y . El teorema clásico de Glivenko-Cantelli implica que esta clase es una clase GC universal. Además, por el teorema de Kolmogorov ,
, es decir, es de clase uniforme Glivenko-Cantelli.
Sea P una medida de probabilidad no atómica en S y una clase de todos los subconjuntos finitos en S . Como , , , tenemos que y por lo tanto no es una clase GC con respecto a P .
^ Howard G. Tucker (1959). "Una generalización del teorema de Glivenko-Cantelli". Anales de estadística matemática . 30 (3): 828–830. doi : 10.1214/aoms/1177706212 . JSTOR 2237422.
^ van der Vaart, AW (1998). Estadísticas asintóticas . Prensa de la Universidad de Cambridge. pag. 279.ISBN978-0-521-78450-4.
^ ab van der Vaart, AW (1998). Estadísticas asintóticas . Prensa de la Universidad de Cambridge. ISBN978-0-521-78450-4.
^ Glivenko, V. (1933). "Sulla determinazione empirica delle leggi di probabilità". Giorn. Ist. Italiano. Attuari (en italiano). 4 : 92–99.
^ Cantelli, FP (1933). "Sulla determinazione empirica delle leggi di probabilità". Giorn. Ist. Italiano. Attuari . 4 : 421–424.
^ Talagrand, M. (1987). "El problema de Glivenko-Cantelli". Anales de probabilidad . 15 : 837–870. doi :10.1214/AOP/1176992069.
^ Dudley, Richard M. ; Giné, Eva; Zinn, Joel C. (1991). "Clases de Glivenko-Cantelli uniformes y universales". Journal of Theoretical Probability . 4 : 485–510. doi :10.1007/BF01210321.
^ Vapnik, VN ; Chervonenkis, A.Ya. (1971). "Sobre la convergencia uniforme de frecuencias relativas de eventos con sus probabilidades". Teoría de la probabilidad y sus aplicaciones . 16 (2): 264–280. doi :10.1137/1116025.
^ Pestov, Vladimir (2011). "Capacidad de aprendizaje de PAC versus dimensión VC: una nota al pie de un resultado básico del aprendizaje estadístico". Conferencia conjunta internacional de 2011 sobre redes neuronales . págs. 1141–1145. arXiv : 1104.2097 . doi :10.1109/IJCNN.2011.6033352.
Pitman, EJG (1979). "La función de distribución de la muestra". Algunas teorías básicas para la inferencia estadística . Londres, Reino Unido: Chapman and Hall. págs. 79–97. ISBN0-470-26554-X.