En teoría de la probabilidad , en particular en el estudio de los procesos estocásticos , un tiempo de detención (también tiempo de Markov , momento de Markov , tiempo de detención opcional o tiempo opcional [1] ) es un tipo específico de “tiempo aleatorio”: una variable aleatoria cuyo valor se interpreta como el momento en el que un proceso estocástico dado exhibe un cierto comportamiento de interés. Un tiempo de detención a menudo se define por una regla de detención , un mecanismo para decidir si continuar o detener un proceso sobre la base de la posición actual y los eventos pasados, y que casi siempre conducirá a una decisión de detenerse en un tiempo finito.
Los tiempos de parada se dan en la teoría de la decisión , y el teorema de parada opcional es un resultado importante en este contexto. Los tiempos de parada también se aplican con frecuencia en las demostraciones matemáticas para “domar el continuo del tiempo”, como lo expresó Chung en su libro (1982).
Sea una variable aleatoria, que se define en el espacio de probabilidad filtrado con valores en . Entonces se denomina tiempo de parada (con respecto a la filtración ), si se cumple la siguiente condición:
Intuitivamente, esta condición significa que la "decisión" de parar o no en un momento dado debe basarse únicamente en la información presente en el momento , no en ninguna información futura.
Sea una variable aleatoria, que se define en el espacio de probabilidad filtrado con valores en . En la mayoría de los casos, . Entonces se denomina tiempo de detención (con respecto a la filtración ), si se cumple la siguiente condición:
Sea una variable aleatoria, que se define en el espacio de probabilidad filtrado con valores en . Entonces se denomina tiempo de detención si el proceso estocástico , definido por
se adapta a la filtración
Algunos autores excluyen explícitamente los casos en los que puede ser , mientras que otros autores permiten tomar cualquier valor en el cierre de .
Para ilustrar algunos ejemplos de momentos aleatorios que detienen las reglas y otros que no, considere a un jugador que juega a la ruleta con una ventaja de la casa típica, comenzando con $100 y apostando $1 al rojo en cada juego:
Para ilustrar la definición más general del tiempo de parada, considere el movimiento browniano , que es un proceso estocástico , donde cada es una variable aleatoria definida en el espacio de probabilidad . Definimos una filtración en este espacio de probabilidad al dejar que sea el σ -álgebra generado por todos los conjuntos de la forma donde y es un conjunto de Borel . Intuitivamente, un evento E está en si y solo si podemos determinar si E es verdadero o falso simplemente observando el movimiento browniano desde el tiempo 0 hasta el tiempo t .
Los tiempos de impacto como el segundo ejemplo anterior pueden ser ejemplos importantes de tiempos de detención. Si bien es relativamente sencillo demostrar que, esencialmente, todos los tiempos de detención son tiempos de impacto, [2] puede ser mucho más difícil demostrar que un determinado tiempo de impacto es un tiempo de detención. Los últimos tipos de resultados se conocen como el teorema de Début .
Los tiempos de detención se utilizan con frecuencia para generalizar ciertas propiedades de los procesos estocásticos a situaciones en las que la propiedad requerida se satisface solo en un sentido local. En primer lugar, si X es un proceso y τ es un tiempo de detención, entonces X τ se utiliza para indicar que el proceso X se detuvo en el tiempo τ .
Entonces, se dice que X satisface localmente alguna propiedad P si existe una secuencia de tiempos de detención τ n , que aumenta hasta el infinito y para la cual los procesos
satisfacen la propiedad P. Algunos ejemplos comunes, con índice de tiempo I = [0, ∞), son los siguientes:
Proceso martingala local . Un proceso X es una martingala local si es càdlàg [ aclaración necesaria ] y existe una secuencia de tiempos de parada τ n crecientes hasta el infinito, de modo que
es una martingala para cada n .
Proceso localmente integrable . Un proceso no negativo y creciente X es localmente integrable si existe una secuencia de tiempos de parada τ n crecientes hasta el infinito, tales que
para cada n .
Los tiempos de parada, con el índice de tiempo establecido I = [0,∞), a menudo se dividen en varios tipos dependiendo de si es posible predecir cuándo están a punto de ocurrir.
Un tiempo de parada τ es predecible si es igual al límite de una secuencia creciente de tiempos de parada τ n que satisfacen τ n < τ siempre que τ > 0. Se dice que la secuencia τ n anuncia τ , y los tiempos de parada predecibles a veces se conocen como anunciables . Ejemplos de tiempos de parada predecibles son los tiempos de impacto de procesos continuos y adaptados . Si τ es el primer momento en el que un proceso continuo y de valor real X es igual a algún valor a , entonces se anuncia mediante la secuencia τ n , donde τ n es el primer momento en el que X está dentro de una distancia de 1/ n de a .
Los tiempos de parada accesibles son aquellos que pueden ser cubiertos por una secuencia de tiempos predecibles. Es decir, el tiempo de parada τ es accesible si, P( τ = τ n para algún n ) = 1, donde τ n son tiempos predecibles.
Un tiempo de parada τ es totalmente inaccesible si nunca puede ser anunciado por una secuencia creciente de tiempos de parada. Equivalentemente, P( τ = σ < ∞) = 0 para cada tiempo predecible σ . Ejemplos de tiempos de parada totalmente inaccesibles incluyen los tiempos de salto de los procesos de Poisson .
Cada tiempo de parada τ puede descomponerse de forma única en un tiempo accesible y uno totalmente inaccesible. Es decir, existe un único tiempo de parada accesible σ y un tiempo totalmente inaccesible υ tales que τ = σ siempre que σ < ∞, τ = υ siempre que υ < ∞ y τ = ∞ siempre que σ = υ = ∞. Nótese que en el enunciado de este resultado de descomposición, los tiempos de parada no tienen por qué ser casi seguramente finitos, y pueden ser iguales a ∞.
Los ensayos clínicos en medicina suelen realizar análisis intermedios para determinar si el ensayo ya ha cumplido con sus criterios de valoración. Sin embargo, los análisis intermedios generan el riesgo de resultados falsos positivos y, por lo tanto, se utilizan límites de detención para determinar la cantidad y el momento del análisis intermedio (también conocido como gasto alfa, para indicar la tasa de falsos positivos). En cada una de las pruebas intermedias R, el ensayo se detiene si la probabilidad es inferior a un umbral p, que depende del método utilizado. Consulte Análisis secuencial .