En teoría de probabilidad , un proceso de Pitman–Yor [1] [2] [3] [4] denotado PY( d , θ , G 0 ), es un proceso estocástico cuya trayectoria de muestra es una distribución de probabilidad . Una muestra aleatoria de este proceso es una distribución de probabilidad discreta infinita, que consiste en un conjunto infinito de átomos extraídos de G 0 , con pesos extraídos de una distribución de Poisson-Dirichlet de dos parámetros . El proceso recibe su nombre de Jim Pitman y Marc Yor .
Los parámetros que rigen el proceso de Pitman-Yor son: 0 ≤ d < 1 un parámetro de descuento, un parámetro de fuerza θ > − d y una distribución base G 0 sobre un espacio de probabilidad X . Cuando d = 0, se convierte en el proceso de Dirichlet . El parámetro de descuento le da al proceso de Pitman-Yor más flexibilidad sobre el comportamiento de las colas que el proceso de Dirichlet, que tiene colas exponenciales. Esto hace que el proceso de Pitman-Yor sea útil para modelar datos con colas de ley de potencia (por ejemplo, frecuencias de palabras en lenguaje natural).
La partición aleatoria intercambiable inducida por el proceso Pitman-Yor es un ejemplo de un proceso de restaurante chino , una partición de Poisson-Kingman y una partición aleatoria de tipo Gibbs.
El nombre "proceso Pitman-Yor" fue acuñado por Ishwaran y James [5] después de la revisión de Pitman y Yor sobre el tema. [2] Sin embargo, el proceso fue estudiado originalmente en Perman et al. [6] [7]
A veces también se lo denomina proceso de Poisson-Dirichlet de dos parámetros, en honor a la generalización de dos parámetros de la distribución de Poisson-Dirichlet que describe la distribución conjunta de los tamaños de los átomos en la medida aleatoria , ordenados estrictamente por orden decreciente.