Nombre de varias familias diferentes de distribuciones de probabilidad.
El término distribución logística generalizada se utiliza como nombre para varias familias diferentes de distribuciones de probabilidad . Por ejemplo, Johnson et al. [1] enumeran cuatro formas, que se enumeran a continuación.
El tipo I también se ha denominado distribución logística-astizada . El tipo IV incluye los otros tipos y se obtiene al aplicar la transformación logit a las variables aleatorias beta . Siguiendo la misma convención que para la distribución log-normal , el tipo IV puede denominarse distribución logística-beta , con referencia a la función logística estándar , que es la inversa de la transformación logit.
Este tipo también se denomina "beta generalizada exponencial del segundo tipo". [1]
La función de distribución acumulativa correspondiente es:
Relación entre tipos
El tipo IV es la forma más general de la distribución. La distribución de tipo III se puede obtener a partir del tipo IV fijando . La distribución de tipo II se puede obtener a partir del tipo IV fijando (y renombrando a ). La distribución de tipo I se puede obtener a partir del tipo IV fijando . La fijación da como resultado la distribución logística estándar .
Propiedades del tipo IV (logística-beta)
La distribución logística generalizada tipo IV , o distribución logística-beta , con parámetros de soporte y forma , tiene (como se muestra arriba) la función de densidad de probabilidad (pdf):
donde es la función logística estándar . Las funciones de densidad de probabilidad para tres conjuntos diferentes de parámetros de forma se muestran en el gráfico, donde las distribuciones se han escalado y desplazado para dar medias cero y varianzas unitarias, con el fin de facilitar la comparación de las formas.
En lo que sigue, se utiliza la notación para denotar la distribución Tipo IV.
Relación con la distribución gamma
Esta distribución se puede obtener en términos de la distribución gamma de la siguiente manera. Sea y independientemente , y sea . Entonces . [2]
Simetría
Si , entonces .
Media y varianza
Utilizando las expectativas logarítmicas de la distribución gamma, la media y la varianza se pueden derivar como:
donde es la función digamma , mientras que es su primera derivada, también conocida como la función trigamma , o la primera función poligamma . Dado que es estrictamente creciente , el signo de la media es el mismo que el signo de . Dado que es estrictamente decreciente, los parámetros de forma también se pueden interpretar como parámetros de concentración. De hecho, como se muestra a continuación, las colas izquierda y derecha respectivamente se vuelven más delgadas a medida que o aumentan. Los dos términos de la varianza representan las contribuciones a la varianza de las partes izquierda y derecha de la distribución.
Cumulantes y asimetría
La función generadora de cumulantes es , donde la función generadora de momentos se da arriba. Los cumulantes , , son las derivadas -ésimas de , evaluadas en :
donde y son las funciones digamma y poligamma. De acuerdo con la derivación anterior, el primer cumulante, , es la media y el segundo, , es la varianza.
El tercer cumulante, , es el tercer momento central , que cuando se escala por la tercera potencia de la desviación estándar da la asimetría :
El signo (y por lo tanto la lateralidad ) de la asimetría es el mismo que el signo de .
Modo
La moda (máxima pdf) se puede derivar encontrando dónde la derivada logarítmica de pdf es cero:
Esto se simplifica a , de modo que: [2]
Comportamiento de la cola
En cada una de las colas izquierda y derecha, uno de los sigmoides en la función de densidad de probabilidad se satura a uno, de modo que la cola está formada por el otro sigmoide. Para un valor negativo grande , la cola izquierda de la función de densidad de probabilidad es proporcional a , mientras que la cola derecha (un valor positivo grande ) es proporcional a . Esto significa que las colas están controladas independientemente por y . Aunque las colas de tipo IV son más pesadas que las de la distribución normal ( , para la varianza ), las medias y varianzas de tipo IV siguen siendo finitas para todos los . Esto contrasta con la distribución de Cauchy para la que la media y la varianza no existen. En los gráficos de función de densidad de probabilidad logarítmica que se muestran aquí, las colas de tipo IV son lineales, las colas de la distribución normal son cuadráticas y las colas de Cauchy son logarítmicas.
Dado un conjunto de datos que se supone que se generó a partir de IID , la estimación del parámetro de máxima verosimilitud es:
donde las líneas de referencia denotan los promedios de las estadísticas suficientes. La estimación de máxima verosimilitud depende de los datos únicamente a través de estas estadísticas promedio. De hecho, en la estimación de máxima verosimilitud, los valores esperados y los promedios coinciden:
que es también donde se desvanecen las derivadas parciales del maximando anterior.
Relaciones con otras distribuciones
Las relaciones con otras distribuciones incluyen:
La relación logarítmica de las variables gamma es de tipo IV como se detalla anteriormente.
Si , entonces tiene una distribución de tipo IV , con parámetros y . Véase distribución beta prima .
Si y , donde se utiliza como parámetro de velocidad de la segunda distribución gamma, entonces tiene una distribución gamma compuesta , que es la misma que , por lo que tiene una distribución de tipo IV .
Si , entonces tiene una distribución de tipo IV , con parámetros y . Véase distribución beta . La función logit , es la inversa de la función logística . Esta relación explica el nombre de beta logística para esta distribución: si la función logística se aplica a las variables beta logísticas, la distribución transformada es beta.
Parámetros de forma grandes
Para valores grandes de los parámetros de forma, , la distribución se vuelve más gaussiana , con:
Esto se demuestra en los gráficos pdf y log pdf aquí.
Generación de variables aleatorias
Dado que el muestreo aleatorio de las distribuciones gamma y beta está fácilmente disponible en muchas plataformas de software, las relaciones anteriores con esas distribuciones se pueden utilizar para generar variantes de la distribución tipo IV.
Generalización con parámetros de localización y escala
Se puede obtener una familia flexible de cuatro parámetros añadiendo los parámetros de escala y de ubicación . Una forma de hacerlo es si , entonces sea , donde es el parámetro de escala y es el parámetro de ubicación. La familia de cuatro parámetros obtenida tiene así la flexibilidad adicional deseada, pero los nuevos parámetros pueden ser difíciles de interpretar porque y . Además, la estimación de máxima verosimilitud con esta parametrización es difícil. Estos problemas se pueden abordar de la siguiente manera.
Recuerde que la media y la varianza de son:
Ahora expanda la familia con el parámetro de ubicación y el parámetro de escala , a través de la transformación:
de modo que y ahora son interpretables. Cabe señalar que permitir que sean positivos o negativos no generaliza esta familia, debido a la propiedad de simetría mencionada anteriormente. Adoptamos la notación para esta familia.
Si el pdf de es , entonces el pdf de es:
donde se entiende que se calcula como se detalla anteriormente, como una función de . Los gráficos pdf y log-pdf anteriores, donde los títulos contienen (medias = 0, varianzas = 1), son para .
Estimación de parámetros de máxima verosimilitud
En esta sección se analiza a su vez la estimación de máxima verosimilitud de los parámetros de distribución, dado un conjunto de datos, para las familias y .
Máxima probabilidad para el tipo IV estándar
Como se señaló anteriormente, es una familia exponencial con parámetros naturales , cuyas estimaciones de máxima verosimilitud dependen únicamente de estadísticas promediadas suficientes:
Una vez acumuladas estas estadísticas, la estimación de máxima verosimilitud viene dada por:
Mediante la parametrización se puede utilizar un algoritmo de optimización numérica sin restricciones como BFGS . Las iteraciones de optimización son rápidas, porque son independientes del tamaño del conjunto de datos.
Máxima verosimilitud para la familia de cuatro parámetros
El problema de máxima verosimilitud para , que tiene función de densidad de probabilidad es:
Ya no se trata de una familia exponencial, por lo que cada iteración de optimización debe recorrer todo el conjunto de datos. Además, el cálculo de las derivadas parciales (como lo requiere, por ejemplo, BFGS) es considerablemente más complejo que para el caso de dos parámetros anterior. Sin embargo, todas las funciones de los componentes están disponibles en paquetes de software con diferenciación automática . Nuevamente, los parámetros positivos se pueden parametrizar en términos de sus logaritmos para obtener un problema de optimización numérica sin restricciones.
En este problema, la optimización numérica puede fallar a menos que los parámetros iniciales de escala y ubicación se elijan adecuadamente. Sin embargo, la interpretabilidad de estos parámetros en la parametrización de mencionada anteriormente se puede utilizar para lograrlo. En concreto, los valores iniciales de y se pueden establecer en la media y la varianza empíricas de los datos.
^ ab Johnson, NL, Kotz, S., Balakrishnan, N. (1995) Distribuciones univariadas continuas, volumen 2 , Wiley. ISBN 0-471-58494-0 (páginas 140-142)
^ por Leigh J. Halliwell (2018). "La distribución log-gamma y el error no normal". S2CID 173176687.{{cite journal}}: Requiere citar revista |journal=( ayuda )
^ CMBishop, Reconocimiento de patrones y aprendizaje automático , Springer 2006.