Distribución de Pareto

Distribución de probabilidad
Pareto tipo I
Función de densidad de probabilidad
Funciones de densidad de probabilidad de Pareto tipo I para varios α
Funciones de densidad de probabilidad de Pareto tipo I para varias con A medida que la distribución se aproxima a donde es la función delta de Dirac . alfa {\estilo de visualización \alpha} incógnita metro = 1. {\displaystyle x_{\mathrm {m} }=1.} alfa , {\displaystyle \alpha \rightarrow \infty,} del ( incógnita incógnita metro ) , {\displaystyle \delta(x-x_{\mathrm {m}}),} del {\estilo de visualización \delta}
Función de distribución acumulativa
Funciones de distribución acumulativa de Pareto tipo I para varios α
Funciones de distribución acumulativa de Pareto tipo I para varios con alfa {\estilo de visualización \alpha} incógnita metro = 1. {\displaystyle x_{\mathrm {m} }=1.}
Parámetros incógnita metro > 0 {\displaystyle x_{\mathrm {m} }>0} escala ( real ) forma (real)
alfa > 0 {\displaystyle \alpha >0}
Apoyo incógnita [ incógnita metro , ) {\displaystyle x\in[x_{\mathrm {m}},\infty)}
PDF alfa incógnita metro alfa incógnita alfa + 1 {\displaystyle {\frac {\alpha x_{\mathrm {m} }^{\alpha }}{x^{\alpha +1}}}}
CDF 1 ( incógnita metro incógnita ) alfa {\displaystyle 1-\left({\frac {x_{\mathrm {m} }}{x}}\right)^{\alpha }}
Cuantil incógnita metro ( 1 pag ) 1 alfa {\displaystyle x_{\mathrm {m} }{(1-p)}^{-{\frac {1}{\alpha }}}}
Significar { para  alfa 1 alfa incógnita metro alfa 1 para  alfa > 1 {\displaystyle {\begin{casos}\infty &{\text{for }}\alpha \leq 1\\{\dfrac {\alpha x_{\mathrm {m} }}{\alpha -1}}&{ \text{para }}\alpha >1\end{casos}}}
Mediana incógnita metro 2 alfa {\displaystyle x_{\mathrm {m} }{\sqrt[{\alpha }]{2}}}
Modo incógnita metro {\displaystyle x_{\mathrm {m} }}
Diferencia { para  alfa 2 incógnita metro 2 alfa ( alfa 1 ) 2 ( alfa 2 ) para  alfa > 2 {\displaystyle {\begin{casos}\infty &{\text{para }}\alpha \leq 2\\{\dfrac {x_{\mathrm {m} }^{2}\alpha }{(\alpha - 1)^{2}(\alpha -2)}}&{\text{para }}\alpha >2\end{casos}}}
Oblicuidad 2 ( 1 + alfa ) alfa 3 alfa 2 alfa  para  alfa > 3 {\displaystyle {\frac {2(1+\alpha )}{\alpha -3}}{\sqrt {\frac {\alpha -2}{\alpha }}}{\text{ para }}\alpha >3}
Exceso de curtosis 6 ( alfa 3 + alfa 2 6 alfa 2 ) alfa ( alfa 3 ) ( alfa 4 )  para  alfa > 4 {\displaystyle {\frac {6(\alpha ^{3}+\alpha ^{2}-6\alpha -2)}{\alpha (\alpha -3)(\alpha -4)}}{\text{ para }}\alpha >4}
Entropía registro ( ( incógnita metro alfa ) mi 1 + 1 alfa ) {\displaystyle \log \left(\left({\frac {x_{\mathrm {m} }}{\alpha }}\right)\,e^{1+{\tfrac {1}{\alpha }}}\right)}
MGFno existe
CF alfa ( i incógnita metro a ) alfa Γ ( alfa , i incógnita metro a ) {\displaystyle \alpha (-ix_{\mathrm {m} }t)^{\alpha }\Gamma (-\alpha ,-ix_{\mathrm {m} }t)}
Información de Fisher I ( incógnita metro , alfa ) = [ alfa 2 incógnita metro 2 0 0 1 alfa 2 ] {\displaystyle {\mathcal {I}}(x_{\mathrm {m} },\alpha )={\begin{bmatrix}{\dfrac {\alpha ^{2}}{x_{\mathrm {m} } ^{2}}}&0\\0&{\dfrac {1}{\alpha ^{2}}}\end{bmatrix}}}
Déficit esperado incógnita metro alfa ( 1 pag ) 1 alfa ( alfa 1 ) {\displaystyle {\frac {x_{m}\alpha }{(1-p)^{\frac {1}{\alpha }}(\alpha -1)}}} [1]

La distribución de Pareto , llamada así por el ingeniero civil , economista y sociólogo italiano Vilfredo Pareto , [2] es una distribución de probabilidad de ley de potencia que se utiliza en la descripción de fenómenos sociales , de control de calidad , científicos , geofísicos , actuariales y muchos otros tipos de fenómenos observables; el principio se aplicó originalmente para describir la distribución de la riqueza en una sociedad, ajustándose a la tendencia de que una gran parte de la riqueza está en manos de una pequeña fracción de la población. [3] [4] El principio de Pareto o "regla 80-20" que establece que el 80% de los resultados se deben al 20% de las causas fue nombrado en honor a Pareto, pero los conceptos son distintos, y solo las distribuciones de Pareto con valor de forma ( α ) de log 4 5 ≈ 1,16 lo reflejan con precisión. La observación empírica ha demostrado que esta distribución 80-20 se ajusta a una amplia gama de casos, incluidos los fenómenos naturales [5] y las actividades humanas. [6] [7]

Definiciones

Si X es una variable aleatoria con una distribución de Pareto (Tipo I), [8] entonces la probabilidad de que X sea mayor que algún número x , es decir, la función de supervivencia (también llamada función de cola), está dada por

F ¯ ( incógnita ) = Pr ( incógnita > incógnita ) = { ( incógnita metro incógnita ) alfa incógnita incógnita metro , 1 incógnita < incógnita metro , {\displaystyle {\overline {F}}(x)=\Pr(X>x)={\begin{cases}\left({\frac {x_{\mathrm {m} }}{x}}\right)^{\alpha }&x\geq x_{\mathrm {m} },\\1&x<x_{\mathrm {m} },\end{cases}}}

donde x m es el valor mínimo posible (necesariamente positivo) de X , y α es un parámetro positivo. La distribución de Pareto de tipo I se caracteriza por un parámetro de escala x m y un parámetro de forma α , que se conoce como índice de cola . Si esta distribución se utiliza para modelar la distribución de la riqueza, entonces el parámetro α se denomina índice de Pareto .

Función de distribución acumulativa

De la definición, la función de distribución acumulativa de una variable aleatoria de Pareto con parámetros α y x m es

F incógnita ( incógnita ) = { 1 ( incógnita metro incógnita ) alfa incógnita incógnita metro , 0 incógnita < incógnita metro . {\displaystyle F_{X}(x)={\begin{cases}1-\left({\frac {x_{\mathrm {m} }}{x}}\right)^{\alpha }&x\geq x_{\mathrm {m} },\\0&x<x_{\mathrm {m} }.\end{cases}}}

Función de densidad de probabilidad

Se deduce (por diferenciación ) que la función de densidad de probabilidad es

F incógnita ( incógnita ) = { alfa incógnita metro alfa incógnita alfa + 1 incógnita incógnita metro , 0 incógnita < incógnita metro . {\displaystyle f_{X}(x)={\begin{casos}{\frac {\alpha x_{\mathrm {m} }^{\alpha }}{x^{\alpha +1}}}&x\ geq x_{\mathrm {m} },\\0&x<x_{\mathrm {m} }.\end{casos}}}

Cuando se representa en ejes lineales, la distribución asume la conocida curva en forma de J que se aproxima a cada uno de los ejes ortogonales de manera asintótica . Todos los segmentos de la curva son autosimilares (sujetos a factores de escala apropiados). Cuando se representa en un gráfico logarítmico-logarítmico , la distribución se representa mediante una línea recta.

Propiedades

Momentos y función característica

mi ( incógnita ) = { alfa 1 , alfa incógnita metro alfa 1 alfa > 1. {\displaystyle \operatorname {E} (X)={\begin{cases}\infty &\alpha \leq 1,\\{\frac {\alpha x_{\mathrm {m} }}{\alpha -1} }&\alpha >1.\end{casos}}}
Variedad ( incógnita ) = { alfa ( 1 , 2 ] , ( incógnita metro alfa 1 ) 2 alfa alfa 2 alfa > 2. {\displaystyle \operatorname {Var} (X)={\begin{cases}\infty &\alpha \in (1,2],\\\left({\frac {x_{\mathrm {m} }}{\alpha -1}}\right)^{2}{\frac {\alpha }{\alpha -2}}&\alpha >2.\end{cases}}}
(Si α ≤ 1, la varianza no existe.)
micras norte " = { alfa norte , alfa incógnita metro norte alfa norte alfa > norte . {\displaystyle \mu _{n}'={\begin{cases}\infty &\alpha \leq n,\\{\frac {\alpha x_{\mathrm {m} }^{n}}{\alpha -n}}&\alpha >n.\end{cases}}}
M ( t ; α , x m ) = E [ e t X ] = α ( x m t ) α Γ ( α , x m t ) {\displaystyle M\left(t;\alpha ,x_{\mathrm {m} }\right)=\operatorname {E} \left[e^{tX}\right]=\alpha (-x_{\mathrm {m} }t)^{\alpha }\Gamma (-\alpha ,-x_{\mathrm {m} }t)}
M ( 0 , α , x m ) = 1. {\displaystyle M\left(0,\alpha ,x_{\mathrm {m} }\right)=1.}

Así, como la expectativa no converge en un intervalo abierto que contenga, decimos que la función generadora de momentos no existe. t = 0 {\displaystyle t=0}

φ ( t ; α , x m ) = α ( i x m t ) α Γ ( α , i x m t ) , {\displaystyle \varphi (t;\alpha ,x_{\mathrm {m} })=\alpha (-ix_{\mathrm {m} }t)^{\alpha }\Gamma (-\alpha ,-ix_{\mathrm {m} }t),}
donde Γ( ax ) es la función gamma incompleta .

Los parámetros pueden resolverse utilizando el método de momentos . [9]

Distribuciones condicionales

La distribución de probabilidad condicional de una variable aleatoria distribuida según Pareto, dado el evento de que sea mayor o igual a un número particular  que excede , es una distribución de Pareto con el mismo índice de Pareto  pero con mínimo  en lugar de : x 1 {\displaystyle x_{1}} x m {\displaystyle x_{\text{m}}} α {\displaystyle \alpha } x 1 {\displaystyle x_{1}} x m {\displaystyle x_{\text{m}}}

Pr ( X x | X x 1 ) = { ( x 1 x ) α x x 1 , 1 x < x 1 . {\displaystyle {\text{Pr}}(X\geq x|X\geq x_{1})={\begin{cases}\left({\frac {x_{1}}{x}}\right)^{\alpha }&x\geq x_{1},\\1&x<x_{1}.\end{cases}}}

Esto implica que el valor esperado condicional (si es finito, es decir ) es proporcional a : α > 1 {\displaystyle \alpha >1} x 1 {\displaystyle x_{1}}

E ( X | X x 1 ) x 1 . {\displaystyle {\text{E}}(X|X\geq x_{1})\propto x_{1}.}

En el caso de variables aleatorias que describen la vida útil de un objeto, esto significa que la esperanza de vida es proporcional a la edad y se denomina efecto Lindy o Ley de Lindy. [10]

Un teorema de caracterización

Supóngase que hay variables aleatorias independientes distribuidas de forma idéntica cuya distribución de probabilidad se sustenta en el intervalo para algún . Supóngase que para todos , las dos variables aleatorias y son independientes. Entonces la distribución común es una distribución de Pareto. [ cita requerida ] X 1 , X 2 , X 3 , {\displaystyle X_{1},X_{2},X_{3},\dotsc } [ x m , ) {\displaystyle [x_{\text{m}},\infty )} x m > 0 {\displaystyle x_{\text{m}}>0} n {\displaystyle n} min { X 1 , , X n } {\displaystyle \min\{X_{1},\dotsc ,X_{n}\}} ( X 1 + + X n ) / min { X 1 , , X n } {\displaystyle (X_{1}+\dotsb +X_{n})/\min\{X_{1},\dotsc ,X_{n}\}}

Media geométrica

La media geométrica ( G ) es [11]

G = x m exp ( 1 α ) . {\displaystyle G=x_{\text{m}}\exp \left({\frac {1}{\alpha }}\right).}

Media armónica

La media armónica ( H ) es [11]

H = x m ( 1 + 1 α ) . {\displaystyle H=x_{\text{m}}\left(1+{\frac {1}{\alpha }}\right).}

Representación gráfica

La característica distribución curva de " cola larga ", cuando se representa gráficamente en una escala lineal, enmascara la simplicidad subyacente de la función cuando se representa gráficamente en un gráfico logarítmico-logarítmico , que luego toma la forma de una línea recta con gradiente negativo: De la fórmula para la función de densidad de probabilidad se deduce que para xx m ,

log f X ( x ) = log ( α x m α x α + 1 ) = log ( α x m α ) ( α + 1 ) log x . {\displaystyle \log f_{X}(x)=\log \left(\alpha {\frac {x_{\mathrm {m} }^{\alpha }}{x^{\alpha +1}}}\right)=\log(\alpha x_{\mathrm {m} }^{\alpha })-(\alpha +1)\log x.}

Como α es positivo, el gradiente −( α  + 1) es negativo.

Distribuciones de Pareto generalizadas

Existe una jerarquía [8] [12] de distribuciones de Pareto conocidas como distribuciones de Pareto tipo I, II, III, IV y de Feller–Pareto. [8] [12] [13] La distribución de Pareto tipo IV contiene las distribuciones de Pareto tipo I–III como casos especiales. La distribución de Feller–Pareto [12] [14] generaliza la distribución de Pareto tipo IV.

Tipos de Pareto I–IV

La jerarquía de la distribución de Pareto se resume en la siguiente tabla comparando las funciones de supervivencia (CDF complementaria).

Cuando μ = 0, la distribución de Pareto tipo II también se conoce como distribución Lomax . [15]

En esta sección, el símbolo x m ​​, utilizado anteriormente para indicar el valor mínimo de x , se reemplaza por  σ .

Distribuciones de Pareto
F ¯ ( x ) = 1 F ( x ) {\displaystyle {\overline {F}}(x)=1-F(x)} ApoyoParámetros
Tipo I [ x σ ] α {\displaystyle \left[{\frac {x}{\sigma }}\right]^{-\alpha }} x σ {\displaystyle x\geq \sigma } σ > 0 , α {\displaystyle \sigma >0,\alpha }
Tipo II [ 1 + x μ σ ] α {\displaystyle \left[1+{\frac {x-\mu }{\sigma }}\right]^{-\alpha }} x μ {\displaystyle x\geq \mu } μ R , σ > 0 , α {\displaystyle \mu \in \mathbb {R} ,\sigma >0,\alpha }
Lomax [ 1 + x σ ] α {\displaystyle \left[1+{\frac {x}{\sigma }}\right]^{-\alpha }} x 0 {\displaystyle x\geq 0} σ > 0 , α {\displaystyle \sigma >0,\alpha }
Tipo III [ 1 + ( x μ σ ) 1 / γ ] 1 {\displaystyle \left[1+\left({\frac {x-\mu }{\sigma }}\right)^{1/\gamma }\right]^{-1}} x μ {\displaystyle x\geq \mu } μ R , σ , γ > 0 {\displaystyle \mu \in \mathbb {R} ,\sigma ,\gamma >0}
Tipo IV [ 1 + ( x μ σ ) 1 / γ ] α {\displaystyle \left[1+\left({\frac {x-\mu }{\sigma }}\right)^{1/\gamma }\right]^{-\alpha }} x μ {\displaystyle x\geq \mu } μ R , σ , γ > 0 , α {\displaystyle \mu \in \mathbb {R} ,\sigma ,\gamma >0,\alpha }

El parámetro de forma α es el índice de cola, μ es la ubicación, σ es la escala, γ es un parámetro de desigualdad. Algunos casos especiales de tipo Pareto (IV) son

P ( I V ) ( σ , σ , 1 , α ) = P ( I ) ( σ , α ) , {\displaystyle P(IV)(\sigma ,\sigma ,1,\alpha )=P(I)(\sigma ,\alpha ),}
P ( I V ) ( μ , σ , 1 , α ) = P ( I I ) ( μ , σ , α ) , {\displaystyle P(IV)(\mu ,\sigma ,1,\alpha )=P(II)(\mu ,\sigma ,\alpha ),}
P ( I V ) ( μ , σ , γ , 1 ) = P ( I I I ) ( μ , σ , γ ) . {\displaystyle P(IV)(\mu ,\sigma ,\gamma ,1)=P(III)(\mu ,\sigma ,\gamma ).}

La finitud de la media y la existencia y finitud de la varianza dependen del índice de cola α (índice de desigualdad γ ). En particular, los momentos δ fraccionarios son finitos para algún δ > 0, como se muestra en la tabla siguiente, donde δ no es necesariamente un número entero.

Momentos de las distribuciones de Pareto I–IV (caso μ = 0)
E [ X ] {\displaystyle \operatorname {E} [X]} Condición E [ X δ ] {\displaystyle \operatorname {E} [X^{\delta }]} Condición
Tipo I σ α α 1 {\displaystyle {\frac {\sigma \alpha }{\alpha -1}}} α > 1 {\displaystyle \alpha >1} σ δ α α δ {\displaystyle {\frac {\sigma ^{\delta }\alpha }{\alpha -\delta }}} δ < α {\displaystyle \delta <\alpha }
Tipo II σ α 1 + μ {\displaystyle {\frac {\sigma }{\alpha -1}}+\mu } α > 1 {\displaystyle \alpha >1} σ δ Γ ( α δ ) Γ ( 1 + δ ) Γ ( α ) {\displaystyle {\frac {\sigma ^{\delta }\Gamma (\alpha -\delta )\Gamma (1+\delta )}{\Gamma (\alpha )}}} 0 < δ < α {\displaystyle 0<\delta <\alpha }
Tipo III σ Γ ( 1 γ ) Γ ( 1 + γ ) {\displaystyle \sigma \Gamma (1-\gamma )\Gamma (1+\gamma )} 1 < γ < 1 {\displaystyle -1<\gamma <1} σ δ Γ ( 1 γ δ ) Γ ( 1 + γ δ ) {\displaystyle \sigma ^{\delta }\Gamma (1-\gamma \delta )\Gamma (1+\gamma \delta )} γ 1 < δ < γ 1 {\displaystyle -\gamma ^{-1}<\delta <\gamma ^{-1}}
Tipo IV σ Γ ( α γ ) Γ ( 1 + γ ) Γ ( α ) {\displaystyle {\frac {\sigma \Gamma (\alpha -\gamma )\Gamma (1+\gamma )}{\Gamma (\alpha )}}} 1 < γ < α {\displaystyle -1<\gamma <\alpha } σ δ Γ ( α γ δ ) Γ ( 1 + γ δ ) Γ ( α ) {\displaystyle {\frac {\sigma ^{\delta }\Gamma (\alpha -\gamma \delta )\Gamma (1+\gamma \delta )}{\Gamma (\alpha )}}} γ 1 < δ < α / γ {\displaystyle -\gamma ^{-1}<\delta <\alpha /\gamma }

Distribución de Feller-Pareto

Feller [12] [14] define una variable de Pareto mediante la transformación U  =  Y −1  − 1 de una variable aleatoria beta , Y , cuya función de densidad de probabilidad es

f ( y ) = y γ 1 1 ( 1 y ) γ 2 1 B ( γ 1 , γ 2 ) , 0 < y < 1 ; γ 1 , γ 2 > 0 , {\displaystyle f(y)={\frac {y^{\gamma _{1}-1}(1-y)^{\gamma _{2}-1}}{B(\gamma _{1},\gamma _{2})}},\qquad 0<y<1;\gamma _{1},\gamma _{2}>0,}

donde B ( ) es la función beta . Si

W = μ + σ ( Y 1 1 ) γ , σ > 0 , γ > 0 , {\displaystyle W=\mu +\sigma (Y^{-1}-1)^{\gamma },\qquad \sigma >0,\gamma >0,}

entonces W tiene una distribución de Feller-Pareto FP( μ , σ , γ , γ 1 , γ 2 ). [8]

Si y son variables Gamma independientes , otra construcción de una variable Feller-Pareto (FP) es [16] U 1 Γ ( δ 1 , 1 ) {\displaystyle U_{1}\sim \Gamma (\delta _{1},1)} U 2 Γ ( δ 2 , 1 ) {\displaystyle U_{2}\sim \Gamma (\delta _{2},1)}

W = μ + σ ( U 1 U 2 ) γ {\displaystyle W=\mu +\sigma \left({\frac {U_{1}}{U_{2}}}\right)^{\gamma }}

y escribimos W ~ FP( μ , σ , γ , δ 1 , δ 2 ). Los casos especiales de la distribución de Feller-Pareto son

F P ( σ , σ , 1 , 1 , α ) = P ( I ) ( σ , α ) {\displaystyle FP(\sigma ,\sigma ,1,1,\alpha )=P(I)(\sigma ,\alpha )}
F P ( μ , σ , 1 , 1 , α ) = P ( I I ) ( μ , σ , α ) {\displaystyle FP(\mu ,\sigma ,1,1,\alpha )=P(II)(\mu ,\sigma ,\alpha )}
F P ( μ , σ , γ , 1 , 1 ) = P ( I I I ) ( μ , σ , γ ) {\displaystyle FP(\mu ,\sigma ,\gamma ,1,1)=P(III)(\mu ,\sigma ,\gamma )}
F P ( μ , σ , γ , 1 , α ) = P ( I V ) ( μ , σ , γ , α ) . {\displaystyle FP(\mu ,\sigma ,\gamma ,1,\alpha )=P(IV)(\mu ,\sigma ,\gamma ,\alpha ).}

Distribución de Pareto inversa / Distribución de potencia

Cuando una variable aleatoria sigue una distribución de Pareto, su inversa sigue una distribución de Pareto inversa. La distribución de Pareto inversa es equivalente a una distribución de potencia [17] Y {\displaystyle Y} X = 1 / Y {\displaystyle X=1/Y}

Y P a ( α , x m ) = α x m α y α + 1 ( y x m ) X i P a ( α , x m ) = P o w e r ( x m 1 , α ) = α x α 1 ( x m 1 ) α ( 0 < x x m 1 ) {\displaystyle Y\sim \mathrm {Pa} (\alpha ,x_{m})={\frac {\alpha x_{m}^{\alpha }}{y^{\alpha +1}}}\quad (y\geq x_{m})\quad \Leftrightarrow \quad X\sim \mathrm {iPa} (\alpha ,x_{m})=\mathrm {Power} (x_{m}^{-1},\alpha )={\frac {\alpha x^{\alpha -1}}{(x_{m}^{-1})^{\alpha }}}\quad (0<x\leq x_{m}^{-1})}

Relación con la distribución exponencial

La distribución de Pareto está relacionada con la distribución exponencial de la siguiente manera. Si X tiene una distribución de Pareto con un mínimo x m ​​y un índice  α , entonces

Y = log ( X x m ) {\displaystyle Y=\log \left({\frac {X}{x_{\mathrm {m} }}}\right)}

se distribuye exponencialmente con un parámetro de velocidad  α . De manera equivalente, si Y se distribuye exponencialmente con una velocidad  α , entonces

x m e Y {\displaystyle x_{\mathrm {m} }e^{Y}}

se distribuye según Pareto con un mínimo x m ​​y un índice  α .

Esto se puede demostrar utilizando las técnicas estándar de cambio de variable:

Pr ( Y < y ) = Pr ( log ( X x m ) < y ) = Pr ( X < x m e y ) = 1 ( x m x m e y ) α = 1 e α y . {\displaystyle {\begin{aligned}\Pr(Y<y)&=\Pr \left(\log \left({\frac {X}{x_{\mathrm {m} }}}\right)<y\right)\\&=\Pr(X<x_{\mathrm {m} }e^{y})=1-\left({\frac {x_{\mathrm {m} }}{x_{\mathrm {m} }e^{y}}}\right)^{\alpha }=1-e^{-\alpha y}.\end{aligned}}}

La última expresión es la función de distribución acumulativa de una distribución exponencial con tasa  α .

La distribución de Pareto se puede construir mediante distribuciones exponenciales jerárquicas. [18] Sea y . Entonces tenemos y, como resultado, . ϕ | a Exp ( a ) {\displaystyle \phi |a\sim {\text{Exp}}(a)} η | ϕ Exp ( ϕ ) {\displaystyle \eta |\phi \sim {\text{Exp}}(\phi )} p ( η | a ) = a ( a + η ) 2 {\displaystyle p(\eta |a)={\frac {a}{(a+\eta )^{2}}}} a + η Pareto ( a , 1 ) {\displaystyle a+\eta \sim {\text{Pareto}}(a,1)}

De manera más general, si (parametrización de velocidad de forma) y , entonces . λ Gamma ( α , β ) {\displaystyle \lambda \sim {\text{Gamma}}(\alpha ,\beta )} η | λ Exp ( λ ) {\displaystyle \eta |\lambda \sim {\text{Exp}}(\lambda )} β + η Pareto ( β , α ) {\displaystyle \beta +\eta \sim {\text{Pareto}}(\beta ,\alpha )}

Equivalentemente, si y , entonces . Y Gamma ( α , 1 ) {\displaystyle Y\sim {\text{Gamma}}(\alpha ,1)} X Exp ( 1 ) {\displaystyle X\sim {\text{Exp}}(1)} x m ( 1 + X Y ) Pareto ( x m , α ) {\displaystyle x_{\text{m}}\!\left(1+{\frac {X}{Y}}\right)\sim {\text{Pareto}}(x_{\text{m}},\alpha )}

Relación con la distribución log-normal

La distribución de Pareto y la distribución log-normal son distribuciones alternativas para describir los mismos tipos de cantidades. Una de las conexiones entre las dos es que ambas son distribuciones de la distribución exponencial de variables aleatorias distribuidas de acuerdo con otras distribuciones comunes, respectivamente la distribución exponencial y la distribución normal . (Véase la sección anterior.)

Relación con la distribución generalizada de Pareto

La distribución de Pareto es un caso especial de la distribución de Pareto generalizada , que es una familia de distribuciones de forma similar, pero que contiene un parámetro adicional de tal manera que el soporte de la distribución está acotado por debajo (en un punto variable), o acotado tanto por encima como por debajo (donde ambos son variables), siendo la distribución de Lomax un caso especial. Esta familia también contiene las distribuciones exponenciales desplazadas y no desplazadas .

La distribución de Pareto con escala y forma es equivalente a la distribución de Pareto generalizada con ubicación , escala y forma y, a la inversa, se puede obtener la distribución de Pareto a partir del GPD tomando y si . x m {\displaystyle x_{m}} α {\displaystyle \alpha } μ = x m {\displaystyle \mu =x_{m}} σ = x m / α {\displaystyle \sigma =x_{m}/\alpha } ξ = 1 / α {\displaystyle \xi =1/\alpha } x m = σ / ξ {\displaystyle x_{m}=\sigma /\xi } α = 1 / ξ {\displaystyle \alpha =1/\xi } ξ > 0 {\displaystyle \xi >0}

Distribución de Pareto acotada

Pareto acotado
Parámetros

L > 0 {\displaystyle L>0} Ubicación ( real ) Ubicación ( real )
H > L {\displaystyle H>L}

α > 0 {\displaystyle \alpha >0} forma (real)
Apoyo L x H {\displaystyle L\leqslant x\leqslant H}
PDF α L α x α 1 1 ( L H ) α {\displaystyle {\frac {\alpha L^{\alpha }x^{-\alpha -1}}{1-\left({\frac {L}{H}}\right)^{\alpha }}}}
CDF 1 L α x α 1 ( L H ) α {\displaystyle {\frac {1-L^{\alpha }x^{-\alpha }}{1-\left({\frac {L}{H}}\right)^{\alpha }}}}
Significar

L α 1 ( L H ) α ( α α 1 ) ( 1 L α 1 1 H α 1 ) , α 1 {\displaystyle {\frac {L^{\alpha }}{1-\left({\frac {L}{H}}\right)^{\alpha }}}\cdot \left({\frac {\alpha }{\alpha -1}}\right)\cdot \left({\frac {1}{L^{\alpha -1}}}-{\frac {1}{H^{\alpha -1}}}\right),\alpha \neq 1}

H L H L ln H L , α = 1 {\displaystyle {\frac {{H}{L}}{{H}-{L}}}\ln {\frac {H}{L}},\alpha =1}
Mediana L ( 1 1 2 ( 1 ( L H ) α ) ) 1 α {\displaystyle L\left(1-{\frac {1}{2}}\left(1-\left({\frac {L}{H}}\right)^{\alpha }\right)\right)^{-{\frac {1}{\alpha }}}}
Diferencia

L α 1 ( L H ) α ( α α 2 ) ( 1 L α 2 1 H α 2 ) , α 2 {\displaystyle {\frac {L^{\alpha }}{1-\left({\frac {L}{H}}\right)^{\alpha }}}\cdot \left({\frac {\alpha }{\alpha -2}}\right)\cdot \left({\frac {1}{L^{\alpha -2}}}-{\frac {1}{H^{\alpha -2}}}\right),\alpha \neq 2} 2 H 2 L 2 H 2 L 2 ln H L , α = 2 {\displaystyle {\frac {2{H}^{2}{L}^{2}}{{H}^{2}-{L}^{2}}}\ln {\frac {H}{L}},\alpha =2}

(este es el segundo momento crudo, no la varianza)
Oblicuidad

L α 1 ( L H ) α α ( L k α H k α ) ( α k ) , α j {\displaystyle {\frac {L^{\alpha }}{1-\left({\frac {L}{H}}\right)^{\alpha }}}\cdot {\frac {\alpha (L^{k-\alpha }-H^{k-\alpha })}{(\alpha -k)}},\alpha \neq j}

(este es el k-ésimo momento bruto, no la asimetría)

La distribución de Pareto acotada (o truncada) tiene tres parámetros: α , L y H . Al igual que en la distribución de Pareto estándar, α determina la forma. L denota el valor mínimo y H denota el valor máximo.

La función de densidad de probabilidad es

α L α x α 1 1 ( L H ) α {\displaystyle {\frac {\alpha L^{\alpha }x^{-\alpha -1}}{1-\left({\frac {L}{H}}\right)^{\alpha }}}} ,

donde L  ≤  x  ≤  H , y α  > 0.

Generación de variables aleatorias acotadas en el sentido de Pareto

Si U se distribuye uniformemente en (0, 1), entonces aplicando el método de transformada inversa [19]

U = 1 L α x α 1 ( L H ) α {\displaystyle U={\frac {1-L^{\alpha }x^{-\alpha }}{1-({\frac {L}{H}})^{\alpha }}}}
x = ( U H α U L α H α H α L α ) 1 α {\displaystyle x=\left(-{\frac {UH^{\alpha }-UL^{\alpha }-H^{\alpha }}{H^{\alpha }L^{\alpha }}}\right)^{-{\frac {1}{\alpha }}}}

es una distribución de Pareto acotada.

Distribución simétrica de Pareto

El propósito de las distribuciones de Pareto simétricas y simétricas cero es capturar alguna distribución estadística especial con un pico de probabilidad agudo y colas de probabilidad largas simétricas. Estas dos distribuciones se derivan de la distribución de Pareto. Las colas de probabilidad largas normalmente significan que la probabilidad decae lentamente y se pueden usar para ajustar una variedad de conjuntos de datos. Pero si la distribución tiene una estructura simétrica con dos colas de decaimiento lento, Pareto no podría hacerlo. Entonces se aplica la distribución de Pareto simétrica o la distribución de Pareto simétrica cero en su lugar. [20]

La función de distribución acumulativa (CDF) de la distribución de Pareto simétrica se define de la siguiente manera: [20]

F ( X ) = P ( x < X ) = { 1 2 ( b 2 b X ) a X < b 1 1 2 ( b X ) a X b {\displaystyle F(X)=P(x<X)={\begin{cases}{\tfrac {1}{2}}({b \over 2b-X})^{a}&X<b\\1-{\tfrac {1}{2}}({\tfrac {b}{X}})^{a}&X\geq b\end{cases}}}

La función de densidad de probabilidad (PDF) correspondiente es: [20]

p ( x ) = a b a 2 ( b + | x b | ) a + 1 , X R {\displaystyle p(x)={ab^{a} \over 2(b+\left\vert x-b\right\vert )^{a+1}},X\in R}

Esta distribución tiene dos parámetros: a y b. Es simétrica respecto de b. Por lo tanto, la esperanza matemática es b. Cuando esto sucede, tiene varianza como se muestra a continuación:

E ( ( x b ) 2 ) = ( x b ) 2 p ( x ) d x = 2 b 2 ( a 2 ) ( a 1 ) {\displaystyle E((x-b)^{2})=\int _{-\infty }^{\infty }(x-b)^{2}p(x)dx={2b^{2} \over (a-2)(a-1)}}

La CDF de la distribución Pareto simétrica cero (ZSP) se define de la siguiente manera:

F ( X ) = P ( x < X ) = { 1 2 ( b b X ) a X < 0 1 1 2 ( b b + X ) a X 0 {\displaystyle F(X)=P(x<X)={\begin{cases}{\tfrac {1}{2}}({b \over b-X})^{a}&X<0\\1-{\tfrac {1}{2}}({\tfrac {b}{b+X}})^{a}&X\geq 0\end{cases}}}

El PDF correspondiente es:

p ( x ) = a b a 2 ( b + | x | ) a + 1 , X R {\displaystyle p(x)={ab^{a} \over 2(b+\left\vert x\right\vert )^{a+1}},X\in R}

Esta distribución es simétrica respecto del cero. El parámetro a está relacionado con la tasa de disminución de la probabilidad y (a/2b) representa la magnitud máxima de la probabilidad. [20]

Distribución multivariante de Pareto

La distribución de Pareto univariante se ha extendido a una distribución de Pareto multivariante . [21]

Inferencia estadística

Estimación de parámetros

La función de verosimilitud para los parámetros de distribución de Pareto α y x m , dada una muestra independiente x = ( x 1x 2 , ...,  x n ), es

L ( α , x m ) = i = 1 n α x m α x i α + 1 = α n x m n α i = 1 n 1 x i α + 1 . {\displaystyle L(\alpha ,x_{\mathrm {m} })=\prod _{i=1}^{n}\alpha {\frac {x_{\mathrm {m} }^{\alpha }}{x_{i}^{\alpha +1}}}=\alpha ^{n}x_{\mathrm {m} }^{n\alpha }\prod _{i=1}^{n}{\frac {1}{x_{i}^{\alpha +1}}}.}

Por lo tanto, la función de verosimilitud logarítmica es

( α , x m ) = n ln α + n α ln x m ( α + 1 ) i = 1 n ln x i . {\displaystyle \ell (\alpha ,x_{\mathrm {m} })=n\ln \alpha +n\alpha \ln x_{\mathrm {m} }-(\alpha +1)\sum _{i=1}^{n}\ln x_{i}.}

Se puede observar que aumenta monótonamente con x m , es decir, cuanto mayor sea el valor de x m , mayor será el valor de la función de verosimilitud. Por lo tanto, como xx m , concluimos que ( α , x m ) {\displaystyle \ell (\alpha ,x_{\mathrm {m} })}

x ^ m = min i x i . {\displaystyle {\widehat {x}}_{\mathrm {m} }=\min _{i}{x_{i}}.}

Para encontrar el estimador de α , calculamos la derivada parcial correspondiente y determinamos dónde es cero:

α = n α + n ln x m i = 1 n ln x i = 0. {\displaystyle {\frac {\partial \ell }{\partial \alpha }}={\frac {n}{\alpha }}+n\ln x_{\mathrm {m} }-\sum _{i=1}^{n}\ln x_{i}=0.}

Por lo tanto, el estimador de máxima verosimilitud para α es:

α ^ = n i ln ( x i / x ^ m ) . {\displaystyle {\widehat {\alpha }}={\frac {n}{\sum _{i}\ln(x_{i}/{\widehat {x}}_{\mathrm {m} })}}.}

El error estadístico esperado es: [22]

σ = α ^ n . {\displaystyle \sigma ={\frac {\widehat {\alpha }}{\sqrt {n}}}.}

Malik (1970) [23] proporciona la distribución conjunta exacta de . En particular, y son independientes y es de Pareto con parámetro de escala x m y parámetro de forma , mientras que tiene una distribución gamma inversa con parámetros de forma y escala n  − 1 y , respectivamente. ( x ^ m , α ^ ) {\displaystyle ({\hat {x}}_{\mathrm {m} },{\hat {\alpha }})} x ^ m {\displaystyle {\hat {x}}_{\mathrm {m} }} α ^ {\displaystyle {\hat {\alpha }}} x ^ m {\displaystyle {\hat {x}}_{\mathrm {m} }} α ^ {\displaystyle {\hat {\alpha }}}

Ocurrencia y aplicaciones

General

Vilfredo Pareto utilizó originalmente esta distribución para describir la asignación de riqueza entre individuos, ya que parecía mostrar bastante bien la forma en que una porción mayor de la riqueza de cualquier sociedad es propiedad de un porcentaje menor de la gente en esa sociedad. También la utilizó para describir la distribución del ingreso. [4] Esta idea a veces se expresa de manera más simple como el principio de Pareto o la "regla 80-20", que dice que el 20% de la población controla el 80% de la riqueza. [24] Como señala Michael Hudson ( The Collapse of Antiquity [2023] p. 85 y n.7) "un corolario matemático [es] que el 10% tendría el 65% de la riqueza, y el 5% tendría la mitad de la riqueza nacional". Sin embargo, la regla 80-20 corresponde a un valor particular de α y, de hecho, los datos de Pareto sobre los impuestos a la renta británicos en su Cours d'économie politique indican que aproximadamente el 30% de la población tenía aproximadamente el 70% de los ingresos. [ cita requerida ] El gráfico de la función de densidad de probabilidad (PDF) al comienzo de este artículo muestra que la "probabilidad" o fracción de la población que posee una pequeña cantidad de riqueza por persona es bastante alta y luego disminuye de manera constante a medida que aumenta la riqueza. (Sin embargo, la distribución de Pareto no es realista para la riqueza del extremo inferior. De hecho, el patrimonio neto puede incluso ser negativo). Esta distribución no se limita a describir la riqueza o los ingresos, sino a muchas situaciones en las que se encuentra un equilibrio en la distribución de lo "pequeño" a lo "grande". Los siguientes ejemplos a veces se consideran aproximadamente distribuidos según Pareto:

  • Las cuatro variables de la restricción presupuestaria del hogar: consumo, ingresos laborales, ingresos de capital y riqueza. [25]
  • Los tamaños de los asentamientos humanos (pocas ciudades, muchas aldeas/pueblos) [26] [27]
  • Distribución del tamaño de los archivos del tráfico de Internet que utiliza el protocolo TCP (muchos archivos más pequeños, pocos más grandes) [26]
  • Tasas de error de la unidad de disco duro [28]
  • Cúmulos de condensado de Bose-Einstein cerca del cero absoluto [29]
Distribución acumulativa de Pareto (Lomax) ajustada a las precipitaciones máximas de un día utilizando CumFreq , consulte también ajuste de distribución
  • Los valores de las reservas de petróleo en los yacimientos petrolíferos (unos pocos yacimientos grandes , muchos yacimientos pequeños ) [26]
  • La distribución de la longitud de los trabajos asignados a las supercomputadoras (unas pocas grandes, muchas pequeñas) [30]
  • Los rendimientos de precios estandarizados de las acciones individuales [26]
  • Tamaños de partículas de arena [26]
  • El tamaño de los meteoritos
  • Gravedad de las grandes pérdidas por accidentes en determinadas líneas de negocio, como responsabilidad civil general, seguros de automóviles comerciales y compensación de trabajadores. [31] [32]
  • Cantidad de tiempo que un usuario de Steam pasa jugando a distintos juegos. (Algunos juegos se juegan mucho, pero la mayoría casi nunca). [2] [ ¿ Investigación original? ]
  • En hidrología, la distribución de Pareto se aplica a eventos extremos, como las precipitaciones máximas anuales de un día y las descargas de los ríos. [33] La imagen azul ilustra un ejemplo de ajuste de la distribución de Pareto a las precipitaciones máximas anuales de un día clasificadas, mostrando también el cinturón de confianza del 90 % basado en la distribución binomial . Los datos de precipitaciones se representan trazando posiciones como parte del análisis de frecuencia acumulada .
  • En la confiabilidad de la distribución de servicios eléctricos (el 80% de los minutos interrumpidos por el cliente ocurren aproximadamente en el 20% de los días de un año determinado).

Relación con la ley de Zipf

La distribución de Pareto es una distribución de probabilidad continua. La ley de Zipf , también llamada a veces distribución zeta , es una distribución discreta, que separa los valores en una clasificación simple. Ambas son una ley de potencia simple con un exponente negativo, escalada de modo que sus distribuciones acumuladas sean iguales a 1. La de Zipf se puede derivar de la distribución de Pareto si los valores (ingresos) se agrupan en rangos de modo que el número de personas en cada grupo siga un patrón de 1/rango. La distribución se normaliza definiendo de modo que donde es el número armónico generalizado . Esto hace que la función de densidad de probabilidad de Zipf se pueda derivar de la de Pareto. x {\displaystyle x} N {\displaystyle N} x m {\displaystyle x_{m}} α x m α = 1 H ( N , α 1 ) {\displaystyle \alpha x_{\mathrm {m} }^{\alpha }={\frac {1}{H(N,\alpha -1)}}} H ( N , α 1 ) {\displaystyle H(N,\alpha -1)}

f ( x ) = α x m α x α + 1 = 1 x s H ( N , s ) {\displaystyle f(x)={\frac {\alpha x_{\mathrm {m} }^{\alpha }}{x^{\alpha +1}}}={\frac {1}{x^{s}H(N,s)}}}

donde y es un número entero que representa un rango de 1 a N, donde N es el nivel de ingresos más alto. Por lo tanto, una persona (o palabra, enlace de sitio web o ciudad) seleccionada al azar de una población (o idioma, Internet o país) tiene una probabilidad de clasificarse en . s = α 1 {\displaystyle s=\alpha -1} x {\displaystyle x} f ( x ) {\displaystyle f(x)} x {\displaystyle x}

Relación con el “principio de Pareto”

La " ley 80-20 ", según la cual el 20% de la población recibe el 80% de los ingresos totales, y el 20% del 20% más rico recibe el 80% de ese 80%, y así sucesivamente, se cumple precisamente cuando el índice de Pareto es . Este resultado se puede derivar de la fórmula de la curva de Lorenz que se muestra a continuación. Además, se ha demostrado [34] que las siguientes fórmulas son matemáticamente equivalentes: α = log 4 5 = log 10 5 log 10 4 1.161 {\displaystyle \alpha =\log _{4}5={\cfrac {\log _{10}5}{\log _{10}4}}\approx 1.161}

  • El ingreso se distribuye según una distribución de Pareto con índice α  > 1.
  • Existe un número 0 ≤  p  ≤ 1/2 tal que el 100 p  % de todas las personas recibe el 100(1 −  p )% de todos los ingresos, y de manera similar para cada número real (no necesariamente entero) n  > 0, el 100 p n  % de todas las personas recibe el 100(1 −  p ) n porcentaje de todos los ingresos. α y p están relacionados por
1 1 α = ln ( 1 p ) ln ( p ) = ln ( ( 1 p ) n ) ln ( p n ) {\displaystyle 1-{\frac {1}{\alpha }}={\frac {\ln(1-p)}{\ln(p)}}={\frac {\ln((1-p)^{n})}{\ln(p^{n})}}}

Esto no se aplica sólo a los ingresos, sino también a la riqueza o a cualquier otra cosa que pueda modelarse mediante esta distribución.

Esto excluye las distribuciones de Pareto en las que 0 <  α  ≤ 1, que, como se señaló anteriormente, tienen un valor esperado infinito y, por lo tanto, no pueden modelar razonablemente la distribución del ingreso.

Relación con la ley de Price

La ley de la raíz cuadrada de Price se presenta a veces como una propiedad de la distribución de Pareto o como algo similar a ella. Sin embargo, la ley solo se cumple en el caso de que . Nótese que, en este caso, la cantidad total y esperada de riqueza no están definidas, y la regla solo se aplica asintóticamente a muestras aleatorias. El principio de Pareto extendido mencionado anteriormente es una regla mucho más general. α = 1 {\displaystyle \alpha =1}

Curva de Lorenz y coeficiente de Gini

Curvas de Lorenz para varias distribuciones de Pareto. El caso α  = ∞ corresponde a una distribución perfectamente igualitaria ( G  = 0) y la línea α  = 1 corresponde a una desigualdad total ( G  = 1)

La curva de Lorenz se utiliza a menudo para caracterizar las distribuciones de ingresos y riqueza. Para cualquier distribución, la curva de Lorenz L ( F ) se escribe en términos de la función de densidad de probabilidad (PDF ) o la función de flujo de efectivo (CDF) F como

L ( F ) = x m x ( F ) x f ( x ) d x x m x f ( x ) d x = 0 F x ( F ) d F 0 1 x ( F ) d F {\displaystyle L(F)={\frac {\int _{x_{\mathrm {m} }}^{x(F)}xf(x)\,dx}{\int _{x_{\mathrm {m} }}^{\infty }xf(x)\,dx}}={\frac {\int _{0}^{F}x(F')\,dF'}{\int _{0}^{1}x(F')\,dF'}}}

donde x ( F ) es la inversa de la CDF. Para la distribución de Pareto,

x ( F ) = x m ( 1 F ) 1 α {\displaystyle x(F)={\frac {x_{\mathrm {m} }}{(1-F)^{\frac {1}{\alpha }}}}}

y se calcula que la curva de Lorenz es

L ( F ) = 1 ( 1 F ) 1 1 α , {\displaystyle L(F)=1-(1-F)^{1-{\frac {1}{\alpha }}},}

Como el denominador es infinito, se obtiene que L = 0. En el gráfico de la derecha se muestran ejemplos de la curva de Lorenz para varias distribuciones de Pareto. 0 < α 1 {\displaystyle 0<\alpha \leq 1}

Según Oxfam (2016) las 62 personas más ricas tienen tanta riqueza como la mitad más pobre de la población mundial. [35] Podemos estimar el índice de Pareto que se aplicaría a esta situación. Si ε es igual, tenemos: 62 / ( 7 × 10 9 ) {\displaystyle 62/(7\times 10^{9})}

L ( 1 / 2 ) = 1 L ( 1 ε ) {\displaystyle L(1/2)=1-L(1-\varepsilon )}

o

1 ( 1 / 2 ) 1 1 α = ε 1 1 α {\displaystyle 1-(1/2)^{1-{\frac {1}{\alpha }}}=\varepsilon ^{1-{\frac {1}{\alpha }}}}

La solución es que α es igual a aproximadamente 1,15 y que aproximadamente el 9% de la riqueza está en manos de cada uno de los dos grupos. Pero en realidad el 69% más pobre de la población adulta mundial posee solo alrededor del 3% de la riqueza. [36]

El coeficiente de Gini es una medida de la desviación de la curva de Lorenz respecto de la línea de equidistribución, que es una línea que conecta [0, 0] y [1, 1], que se muestra en negro ( α  = ∞) en el gráfico de Lorenz de la derecha. Específicamente, el coeficiente de Gini es el doble del área entre la curva de Lorenz y la línea de equidistribución. El coeficiente de Gini para la distribución de Pareto se calcula entonces (para ) como α 1 {\displaystyle \alpha \geq 1}

G = 1 2 ( 0 1 L ( F ) d F ) = 1 2 α 1 {\displaystyle G=1-2\left(\int _{0}^{1}L(F)\,dF\right)={\frac {1}{2\alpha -1}}}

(véase Aaberge 2005).

Generación de variables aleatorias

Se pueden generar muestras aleatorias utilizando el muestreo por transformada inversa . Dada una variable aleatoria U extraída de la distribución uniforme en el intervalo unitario [0, 1], la variable T dada por

T = x m U 1 / α {\displaystyle T={\frac {x_{\mathrm {m} }}{U^{1/\alpha }}}}

se distribuye según Pareto. [37]

Véase también

Referencias

  1. ^ ab Norton, Matthew; Khokhlov, Valentyn; Uryasev, Stan (2019). "Cálculo de CVaR y bPOE para distribuciones de probabilidad comunes con aplicación a la optimización de carteras y estimación de densidad" (PDF) . Anales de investigación de operaciones . 299 (1–2). Springer: 1281–1315. arXiv : 1811.11301 . doi :10.1007/s10479-019-03373-1. S2CID  254231768 . Consultado el 27 de febrero de 2023 .
  2. ^ Amoroso, Luigi (1938). "VILFREDO PARETO". Econométrica (anterior a 1986); enero de 1938; 6, 1; ProQuest . 6 .
  3. ^ Pareto, Vilfredo (1898). "Curso de economía política". Revista de Economía Política . 6 . doi :10.1086/250536.
  4. ^ ab Pareto, Vilfredo, Cours d'Économie Politique: Nouvelle édition par G.-H. Bousquet et G. Busino , Librairie Droz, Ginebra, 1964, págs. 299–345. Libro original archivado
  5. ^ VAN MONTFORT, MAJ (1986). "La distribución generalizada de Pareto aplicada a las profundidades de la lluvia". Revista de Ciencias Hidrológicas . 31 (2): 151–162. Código Bibliográfico :1986HydSJ..31..151V. doi : 10.1080/02626668609491037 .
  6. ^ Oancea, Bogdan (2017). "Desigualdad de ingresos en Rumania: la distribución exponencial de Pareto". Physica A: Mecánica estadística y sus aplicaciones . 469 : 486–498. Bibcode :2017PhyA..469..486O. doi :10.1016/j.physa.2016.11.094.
  7. ^ Morella, Mateo. "Distribución de Pareto". academia.edu .
  8. ^ abcd Barry C. Arnold (1983). Distribuciones de Pareto . Editorial Cooperativa Internacional. ISBN 978-0-89974-012-6.
  9. ^ S. Hussain, SH Bhatti (2018). Estimación de parámetros de la distribución de Pareto: algunos estimadores de momento modificados. Maejo International Journal of Science and Technology 12(1):11-27.
  10. ^ Eliazar, Iddo (noviembre de 2017). "Ley de Lindy". Physica A: Mecánica estadística y sus aplicaciones . 486 : 797–805. Bibcode :2017PhyA..486..797E. doi :10.1016/j.physa.2017.05.077. S2CID  125349686.
  11. ^ ab Johnson NL, Kotz S, Balakrishnan N (1994) Distribuciones univariadas continuas Vol 1. Series de Wiley en probabilidad y estadística.
  12. ^ abcd Johnson, Kotz y Balakrishnan (1994), (20.4).
  13. ^ Christian Kleiber y Samuel Kotz (2003). Distribuciones estadísticas de tamaño en economía y ciencias actuariales. Wiley . ISBN 978-0-471-15064-0.
  14. ^ ab Feller, W. (1971). Introducción a la teoría de la probabilidad y sus aplicaciones . Vol. II (2.ª ed.). Nueva York: Wiley. pág. 50."Las densidades (4.3) se denominan a veces en honor al economista Pareto . Se pensaba (de manera bastante ingenua desde un punto de vista estadístico moderno) que las distribuciones de ingresos deberían tener una cola con una densidad ~ Ax α cuando x  → ∞".
  15. ^ Lomax, KS (1954). "Fracasos empresariales. Otro ejemplo del análisis de datos de fracasos". Journal of the American Statistical Association . 49 (268): 847–52. doi :10.1080/01621459.1954.10501239.
  16. ^ Chotikapanich, Duangkamon (16 de septiembre de 2008). "Capítulo 7: Distribuciones de Pareto y de Pareto generalizadas". Modelado de distribuciones de ingresos y curvas de Lorenz . Springer. págs. 121–22. ISBN 9780387727967.
  17. ^ Dallas, AC "Caracterización de las distribuciones de Pareto y de potencia". Anales del Instituto de Matemática Estadística 28.1 (1976): 491-497.
  18. ^ White, Gentry (2006). Modelado espacial semiparamétrico bayesiano y modelado espacio-temporal conjunto (Tesis). Universidad de Missouri-Columbia.Sección 5.3.1.
  19. ^ "Método de transformación inversa". Archivado desde el original el 17 de enero de 2012. Consultado el 27 de agosto de 2012 .
  20. ^ abcd Huang, Xiao-dong (2004). "Un modelo multiescala para el tráfico de vídeo de velocidad de bits variable MPEG-4". IEEE Transactions on Broadcasting . 50 (3): 323–334. doi :10.1109/TBC.2004.834013.
  21. ^ Rootzen, Holger; Tajvidi, Nader (2006). "Distribuciones de Pareto generalizadas multivariadas". Bernoulli . 12 (5): 917–30. CiteSeerX 10.1.1.145.2991 . doi :10.3150/bj/1161614952. S2CID  16504396. 
  22. ^ MEJ Newman (2005). "Leyes de potencia, distribuciones de Pareto y ley de Zipf". Física contemporánea . 46 (5): 323–51. arXiv : cond-mat/0412004 . Código Bibliográfico :2005ConPh..46..323N. doi :10.1080/00107510500052444. S2CID  202719165.
  23. ^ HJ Malik (1970). "Estimación de los parámetros de la distribución de Pareto". Metrika . 15 : 126–132. doi :10.1007/BF02613565. S2CID  124007966.
  24. ^ Para una población de dos cuartiles, donde aproximadamente el 18% de la población posee el 82% de la riqueza, el índice de Theil toma el valor 1.
  25. ^ Gaillard, Alejandro; Hellwig, cristiano; Wangner, Philipp; Werquin, Nicolás (2023). "Consumo, riqueza y desigualdad de ingresos: una historia de colas". SSRN  4636704.
  26. ^ abcde Reed, William J.; et al. (2004). "La distribución lognormal de Pareto doble: un nuevo modelo paramétrico para distribuciones de tamaño". Comunicaciones en estadística: teoría y métodos . 33 (8): 1733–53. CiteSeerX 10.1.1.70.4555 . doi :10.1081/sta-120037438. S2CID  13906086. 
  27. ^ Reed, William J. (2002). "Sobre la distribución de rangos y tamaños para asentamientos humanos". Journal of Regional Science . 42 (1): 1–17. Bibcode :2002JRegS..42....1R. doi :10.1111/1467-9787.00247. S2CID  154285730.
  28. ^ Schroeder, Bianca ; Damouras, Sotirios; Gill, Phillipa (2010-02-24). "Entender el error del sector latente y cómo protegerse contra él" (PDF) . 8.ª Conferencia de Usenix sobre tecnologías de archivos y almacenamiento (FAST 2010) . Consultado el 10 de septiembre de 2010 . Experimentamos con 5 distribuciones diferentes (geométrica, Weibull, Rayleigh, Pareto y lognormal), que se utilizan comúnmente en el contexto de la confiabilidad del sistema, y ​​evaluamos su ajuste a través de las diferencias cuadradas totales entre las frecuencias reales y las hipotéticas (estadística χ 2 ). Encontramos de manera consistente en todos los modelos que la distribución geométrica es un ajuste deficiente, mientras que la distribución de Pareto proporciona el mejor ajuste.
  29. ^ Yuji Ijiri; Simon, Herbert A. (mayo de 1975). "Algunas distribuciones asociadas con las estadísticas de Bose-Einstein". Proc. Natl. Sci. USA . 72 (5): 1654–57. Bibcode :1975PNAS...72.1654I. doi : 10.1073/pnas.72.5.1654 . PMC 432601 . PMID  16578724. 
  30. ^ Harchol-Balter, Mor ; Downey, Allen (agosto de 1997). "Explotación de distribuciones de vida útil de procesos para el equilibrio dinámico de carga" (PDF) . ACM Transactions on Computer Systems . 15 (3): 253–258. doi :10.1145/263326.263344. S2CID  52861447.
  31. ^ Kleiber y Kotz (2003): pág. 94.
  32. ^ Seal, H. (1980). "Probabilidades de supervivencia basadas en distribuciones de reclamaciones de Pareto". Boletín ASTIN . 11 : 61–71. doi : 10.1017/S0515036100006620 .
  33. ^ CumFreq, software para análisis de frecuencia acumulativa y ajuste de distribución de probabilidad [1]
  34. ^ Hardy, Michael (2010). "Ley de Pareto". Inteligencia matemática . 32 (3): 38–43. doi :10.1007/s00283-010-9159-2. S2CID  121797873.
  35. ^ "62 personas poseen lo mismo que la mitad del mundo, según el informe de Oxfam en Davos". Oxfam. Enero de 2016.
  36. ^ "Informe sobre la riqueza mundial 2013". Credit Suisse. Oct 2013. p. 22. Archivado desde el original el 14 de febrero de 2015. Consultado el 24 de enero de 2016 .
  37. ^ Tanizaki, Hisashi (2004). Métodos computacionales en estadística y econometría. CRC Press. pág. 133. ISBN 9780824750886.

Notas

  • Pareto, Vilfredo (1895). "La legge della domanda". Giornale degli Economisti . 10 : 59–68.
  • Pareto, Vilfredo (1896). "Curses de economía política". doi :10.1177/000271629700900314. S2CID  143528002. {{cite journal}}: Requiere citar revista |journal=( ayuda )
  • Crovella, Mark E. ; Bestavros, Azer (diciembre de 1997). Autosimilitud en el tráfico de la World Wide Web: evidencia y posibles causas (PDF) . IEEE/ACM Transactions on Networking. Vol. 5. págs. 835–846. Archivado desde el original (PDF) el 2016-03-04 . Consultado el 2019-02-25 .
  • syntraf1.c es un programa en C para generar tráfico de paquetes sintéticos con un tamaño de ráfaga de Pareto limitado y un tiempo entre ráfagas exponencial.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Pareto_distribution&oldid=1247213874"