Índice de Theil

Índice para medir la desigualdad económica

El índice de Theil es una estadística utilizada principalmente para medir la desigualdad económica [1] y otros fenómenos económicos, aunque también se ha utilizado para medir la segregación racial. [2] [3] El índice de Theil T T es lo mismo que la redundancia en la teoría de la información , que es la entropía máxima posible de los datos menos la entropía observada. Es un caso especial del índice de entropía generalizado . Puede verse como una medida de redundancia, falta de diversidad, aislamiento, segregación, desigualdad, no aleatoriedad y compresibilidad. Fue propuesto por el econometrista holandés Henri Theil (1924-2000) en la Universidad Erasmus de Róterdam . [3]

El propio Henri Theil dijo (1967): “El índice (de Theil) puede interpretarse como el contenido de información esperado del mensaje indirecto que transforma las proporciones de población como probabilidades previas en proporciones de ingresos como probabilidades posteriores”. [4] Amartya Sen señaló: “Pero el hecho es que el índice de Theil es una fórmula arbitraria, y el promedio de los logaritmos de los recíprocos de las proporciones de ingresos ponderados por los ingresos no es una medida que rebose exactamente de sentido intuitivo”. [4]

Fórmula

Para una población de N "agentes" cada uno con la característica x , la situación puede representarse mediante la lista x i ( i  = 1,..., N ) donde x i es la característica del agente i . Por ejemplo, si la característica es el ingreso, entonces x i es el ingreso del agente i .

El índice T de Theil se define como [5]

yo yo = yo alfa = 1 = 1 norte i = 1 norte incógnita i micras En ( incógnita i micras ) {\displaystyle T_{T}=T_{\alpha =1}={\frac {1}{N}}\sum _{i=1}^{N}{\frac {x_{i}}{\mu }}\ln \left({\frac {x_{i}}{\mu }}\right)}

y el índice L de Theil se define como [5]

yo yo = yo alfa = 0 = 1 norte i = 1 norte En ( micras incógnita i ) {\displaystyle T_{L}=T_{\alpha =0}={\frac {1}{N}}\sum _{i=1}^{N}\ln \left({\frac {\mu }{x_{i}}}\right)}

¿Dónde está el ingreso medio? micras {\estilo de visualización \mu}

micras = 1 norte i = 1 norte incógnita i {\displaystyle \mu ={\frac {1}{N}}\sum _{i=1}^{N}x_{i}}

Theil-L es la desentropía de la distribución del ingreso por persona, medida con respecto a la entropía máxima (...que se logra con completa igualdad).

(En una interpretación alternativa, Theil-L es el logaritmo natural de la media geométrica de la relación: (ingreso medio)/(ingreso i), sobre todos los ingresos. El Atkinson(1) relacionado es simplemente 1 menos la media geométrica de (ingreso i)/(ingreso medio), sobre la distribución del ingreso).

Dado que una transferencia entre un ingreso mayor y uno menor cambiará la relación del ingreso menor más de lo que cambia la relación del ingreso mayor, el principio de transferencia se satisface con este índice.

De manera equivalente, si la situación se caracteriza por una función de distribución discreta f k ( k  = 0,..., W ) donde f k es la fracción de la población con ingresos k y W = es el ingreso total, entonces y el índice de Theil es: a = 0 Yo F a = 1 {\displaystyle \sum _{k=0}^{W}f_{k}=1}

yo yo = a = 0 Yo F a a micras En ( a micras ) {\displaystyle T_{T}=\sum _{k=0}^{W}\,f_{k}\,{\frac {k}{\mu }}\ln \left({\frac {k}{\mu }}\right)}

¿Dónde está nuevamente el ingreso medio? micras {\estilo de visualización \mu}

micras = a = 0 Yo a F a {\displaystyle \mu =\sum _ {k=0}^{W}kf_{k}}

Nótese que en este caso el ingreso k es un número entero y k=1 representa el menor incremento de ingreso posible (por ejemplo, centavos).

Si la situación se caracteriza por una función de distribución continua f ( k ) (sostenida desde 0 hasta el infinito) donde f ( kdk es la fracción de la población con ingresos k a k  +  dk , entonces el índice de Theil es:

yo yo = 0 F ( a ) a micras En ( a micras ) d a {\displaystyle T_{T}=\int _{0}^{\infty }f(k){\frac {k}{\mu }}\ln \left({\frac {k}{\mu }}\right)dk}

donde la media es:

micras = 0 a F ( a ) d a {\displaystyle \mu =\int _{0}^{\infty }kf(k)\,dk}

Los índices de Theil para algunas distribuciones de probabilidad continua comunes se dan en la siguiente tabla:

Función de distribución del ingresoPDF( x ) ( x ≥ 0)Coeficiente de Theil (nats)
Función delta de Dirac del ( incógnita incógnita 0 ) , incógnita 0 > 0 {\displaystyle \delta(x-x_{0}),\,x_{0}>0} 0
Distribución uniforme { 1 b a a incógnita b 0 de lo contrario {\displaystyle {\begin{cases}{\frac {1}{ba}}&a\leq x\leq b\\0&{\text{de lo contrario}}\end{cases}}} En ( 2 a ( a + b ) mi ) + b 2 b 2 a 2 En ( b / a ) {\displaystyle \ln \left({\frac {2a}{(a+b){\sqrt {e}}}}\right)+{\frac {b^{2}}{b^{2}-a^{2}}}\ln(b/a)}
Distribución exponencial la mi incógnita la , incógnita > 0 {\displaystyle \lambda e^{-x\lambda },\,\,x>0} 1 {\displaystyle 1-} γ {\displaystyle \gamma }
Distribución log-normal 1 σ 2 π e ( ( ln ( x ) μ ) 2 ) / σ 2 {\displaystyle {\frac {1}{\sigma {\sqrt {2\pi }}}}e^{(-(\ln(x)-\mu )^{2})/\sigma ^{2}}} σ 2 2 {\displaystyle {\frac {\sigma ^{2}}{2}}}
Distribución de Pareto { α k α x α + 1 x k 0 x < k {\displaystyle {\begin{cases}{\frac {\alpha k^{\alpha }}{x^{\alpha +1}}}&x\geq k\\0&x<k\end{cases}}} ln ( 1 1 / α ) + 1 α 1 {\displaystyle \ln(1\!-\!1/\alpha )+{\frac {1}{\alpha -1}}}     (α>1)
Distribución de chi-cuadrado 2 k / 2 e x / 2 x k / 2 1 Γ ( k / 2 ) {\displaystyle {\frac {2^{-k/2}e^{-x/2}x^{k/2-1}}{\Gamma (k/2)}}} ln ( 2 / k ) + {\displaystyle \ln(2/k)+} ψ ( 0 ) {\displaystyle \psi ^{(0)}} ( 1 + k / 2 ) {\displaystyle (1\!+\!k/2)}
Distribución gamma [6] e x / θ x k 1 θ k Γ ( k ) {\displaystyle {\frac {e^{-x/\theta }x^{k-1}\theta ^{-k}}{\Gamma (k)}}} ψ ( 0 ) {\displaystyle \psi ^{(0)}} ( 1 + k ) ln ( k ) {\displaystyle (1+k)-\ln(k)}
Distribución de Weibull k λ ( x λ ) k 1 e ( x / λ ) k {\displaystyle {\frac {k}{\lambda }}\left({\frac {x}{\lambda }}\right)^{k-1}e^{-(x/\lambda )^{k}}} 1 k {\displaystyle {\frac {1}{k}}} ψ ( 0 ) {\displaystyle \psi ^{(0)}} ( 1 + 1 / k ) ln ( Γ ( 1 + 1 / k ) ) {\displaystyle (1+1/k)-\ln \left(\Gamma (1+1/k)\right)}

Si todos tienen el mismo ingreso, entonces T T es igual a 0. Si una persona tiene todos los ingresos, entonces T T da como resultado , que es la máxima desigualdad. Dividir T T por puede normalizar la ecuación para que oscile entre 0 y 1, pero entonces se viola el axioma de independencia : y no califica como una medida de desigualdad. ln N {\displaystyle \ln N} ln N {\displaystyle \ln N} T [ x x ] T [ x ] {\displaystyle T[x\cup x]\neq T[x]}

El índice de Theil mide la "distancia" entrópica que separa a la población del estado igualitario en el que todos tienen los mismos ingresos. El resultado numérico se expresa en términos de entropía negativa, de modo que un número más alto indica un orden más alejado de la igualdad total. Si se formula el índice para que represente la entropía negativa en lugar de la entropía, se puede considerar una medida de desigualdad en lugar de igualdad.

Relación con el índice de Atkinson

El índice de Theil se puede transformar en un índice de Atkinson , que tiene un rango entre 0 y 1 (0% y 100%), donde 0 indica igualdad perfecta y 1 (100%) indica desigualdad máxima. (Ver índice de entropía generalizado para la transformación).

Derivación de la entropía

El índice de Theil se deriva de la medida de entropía de la información de Shannon , donde la entropía es una medida de aleatoriedad en un conjunto dado de información. En teoría de la información, física y el índice de Theil, la forma general de entropía es S {\displaystyle S}

S = k i = 1 N ( p i log a ( 1 p i ) ) = k i = 1 N ( p i log a ( p i ) ) {\displaystyle S=k\sum _{i=1}^{N}\left(p_{i}\log _{a}\left({\frac {1}{p_{i}}}\right)\right)=-k\sum _{i=1}^{N}\left(p_{i}\log _{a}\left({p_{i}}\right)\right)}
dónde
  • i {\displaystyle i} es un elemento individual del conjunto (como un miembro individual de una población o un byte individual de un archivo de computadora).
  • p i {\displaystyle p_{i}} es la probabilidad de encontrarlo a partir de una muestra aleatoria del conjunto. i {\displaystyle i}
  • k {\displaystyle k} es una constante. [nota 1]
  • log a ( x ) {\displaystyle \log _{a}\left({x}\right)} es un logaritmo con base igual a . [nota 2] a {\displaystyle a}

Al observar la distribución del ingreso en una población, es igual a la relación entre el ingreso de un individuo en particular y el ingreso total de toda la población. Esto da como resultado que la entropía observada de una población sea: p i {\displaystyle p_{i}} S Theil {\displaystyle S_{\text{Theil}}}

S Theil = i = 1 N ( x i N x ¯ ln ( N x ¯ x i ) ) {\displaystyle S_{\text{Theil}}=\sum _{i=1}^{N}\left({\frac {x_{i}}{N{\bar {x}}}}\ln \left({\frac {N{\bar {x}}}{x_{i}}}\right)\right)}
dónde
  • x i {\displaystyle x_{i}} es el ingreso de un individuo en particular.
  • ( N x ¯ ) {\displaystyle \left(N{\bar {x}}\right)} es el ingreso total de toda la población, con
  • N {\displaystyle N} siendo el número de individuos en la población.
  • x ¯ {\displaystyle {\bar {x}}} ("barra x") siendo el ingreso promedio de la población.
  • ln ( x ) {\displaystyle \ln \left(x\right)} es el logaritmo natural de : . x {\displaystyle x} ( log e ( x ) ) {\displaystyle \left(\log _{e}\left(x\right)\right)}

El índice de Theil mide la distancia entre la entropía observada ( , que representa la distribución aleatoria de los ingresos) y la entropía más alta posible ( , [nota 3] que representa la distribución máxima de los ingresos entre los individuos de la población, una distribución análoga al resultado [más probable] de un número infinito de lanzamientos aleatorios de una moneda: una distribución igualitaria de caras y cruces). Por lo tanto, el índice de Theil es la diferencia entre la entropía máxima teórica (que se alcanzaría si los ingresos de cada individuo fueran iguales) menos la entropía observada: T T {\displaystyle T_{T}} S Theil {\displaystyle S_{\text{Theil}}} S max = ln ( N ) {\displaystyle S_{\text{max}}=\ln \left({N}\right)}

T T = S max S Theil = ln ( N ) S Theil {\displaystyle T_{T}=S_{\text{max}}-S_{\text{Theil}}=\ln \left({N}\right)-S_{\text{Theil}}}


Cuando se expresa en unidades de población/especie, es una medida de biodiversidad y se denomina índice de Shannon . Si se utiliza el índice de Theil con x=población/especie, es una medida de desigualdad de la población entre un conjunto de especies, o "bioaislamiento" en contraposición a "aislamiento por riqueza". x {\displaystyle x} S Theil {\displaystyle S_{\text{Theil}}}

El índice de Theil mide lo que se denomina redundancia en la teoría de la información. [5] Es el "espacio de información" sobrante que no se utilizó para transmitir información, lo que reduce la eficacia de la señal de precios . [ ¿ Investigación original? ] El índice de Theil es una medida de la redundancia de ingresos (u otra medida de riqueza) en algunos individuos. La redundancia en algunos individuos implica escasez en otros. Un índice de Theil alto indica que el ingreso total no se distribuye de manera uniforme entre los individuos de la misma manera que un archivo de texto sin comprimir no tiene una cantidad similar de ubicaciones de bytes asignadas a los caracteres de bytes únicos disponibles.

NotaciónTeoría de la informaciónÍndice de Theil T T
N {\displaystyle N} Número de caracteres únicosNúmero de individuos
i {\displaystyle i} Un personaje particularUn individuo en particular
x i {\displaystyle x_{i}} recuento del i -ésimo carácterIngresos del individuo i
N x ¯ {\displaystyle N{\bar {x}}} Total de caracteres en el documentoingreso total en la población
T T {\displaystyle T_{T}} espacio de información no utilizadoPotencial no utilizado en el mecanismo de precios [ ¿investigación original? ]
compresión de datosimpuesto progresivo [ investigación original? ]

Descomponibilidad

Según el Banco Mundial ,

"Las medidas de entropía más conocidas son la T de Theil ( ) y la L de Theil ( ), ambas permiten descomponer la desigualdad en la parte que se debe a la desigualdad dentro de las áreas (por ejemplo, urbana, rural) y la parte que se debe a las diferencias entre áreas (por ejemplo, la brecha de ingresos rural-urbana). Normalmente, al menos tres cuartas partes de la desigualdad en un país se debe a la desigualdad dentro de los grupos, y la cuarta parte restante a las diferencias entre grupos". [7] T T {\displaystyle T_{T}} T L {\displaystyle T_{L}}

Si la población se divide en subgrupos y m {\displaystyle m}

  • s i {\displaystyle s_{i}} es la participación en los ingresos del grupo , i {\displaystyle i}
  • N {\displaystyle N} es la población total y es la población del grupo , N i {\displaystyle N_{i}} i {\displaystyle i}
  • T i {\displaystyle T_{i}} es el índice de Theil para ese subgrupo,
  • x ¯ i {\displaystyle {\overline {x}}_{i}} es el ingreso promedio en el grupo , y i {\displaystyle i}
  • μ {\displaystyle \mu } es el ingreso medio de la población,

Entonces el índice T de Theil es

T T = i = 1 m s i T i + i = 1 m s i ln x ¯ i μ {\displaystyle T_{T}=\sum _{i=1}^{m}s_{i}T_{i}+\sum _{i=1}^{m}s_{i}\ln {\frac {{\overline {x}}_{i}}{\mu }}} para s i = N i N x ¯ i μ {\displaystyle s_{i}={\frac {N_{i}}{N}}{\frac {{\overline {x}}_{i}}{\mu }}}

Por ejemplo, la desigualdad dentro de Estados Unidos es la desigualdad promedio dentro de cada estado, ponderada por el ingreso estatal, más la desigualdad entre estados.

Mapa de la desigualdad económica en Estados Unidos utilizando el índice de Theil. Un índice de Theil positivo alto indica más ingresos que población, mientras que un valor negativo muestra más población que ingresos. Un valor de cero muestra igualdad entre población e ingresos.
Mapa de la desigualdad económica en Estados Unidos utilizando el índice de Theil. Un índice de Theil positivo alto indica más ingresos que población, mientras que un valor negativo muestra más población que ingresos. Un valor de cero muestra igualdad entre población e ingresos.
Nota : Esta imagen no representa el índice de Theil de cada zona de los Estados Unidos, sino las contribuciones al índice de Theil de los Estados Unidos por cada zona. El índice de Theil siempre es positivo, aunque las contribuciones individuales al índice de Theil pueden ser negativas o positivas.

La descomposición del índice de Theil, que identifica la proporción atribuible al componente entre regiones, se convierte en una herramienta útil para el análisis positivo de la desigualdad regional, ya que sugiere la importancia relativa de la dimensión espacial de la desigualdad. [8]

De Theilyocontra Theilyo

Tanto la T de Theil como la L de Theil son descomponibles. La diferencia entre ellas se basa en la parte de la distribución de resultados para la que se utiliza cada una. Los índices de desigualdad en la familia de entropía generalizada (GE) son más sensibles a las diferencias en las participaciones en el ingreso entre los pobres o entre los ricos, dependiendo de un parámetro que define el índice GE. Cuanto menor sea el valor del parámetro para GE, más sensible será a las diferencias en la parte inferior de la distribución. [9]

GE(0) = L de Theil y es más sensible a las diferencias en el extremo inferior de la distribución. También se la conoce como medida de desviación logarítmica media .
GE(1) = T de Theil y es más sensible a las diferencias en la parte superior de la distribución.

La descomponibilidad es una propiedad del índice de Theil que el más popular coeficiente de Gini no ofrece. El coeficiente de Gini es más intuitivo para muchas personas, ya que se basa en la curva de Lorenz . Sin embargo, no es fácilmente descomponible como el de Theil.

Aplicaciones

Además de su multitud de aplicaciones económicas, el índice de Theil se ha aplicado para evaluar el rendimiento de los sistemas de riego [10] y la distribución de métricas de software . [11]

Véase también

Notas

  1. ^ Cuando esta ecuación se utiliza en física, normalmente representa la constante de Boltzmann . En teoría de la información o estadística, normalmente es igual a 1 (como en el índice de Theil). k {\displaystyle k} k {\displaystyle k}
  2. ^ En teoría de la información, cuando la información se da en dígitos binarios, se utiliza el logaritmo binario (cuyo valor es 2). En física y también en el cálculo del índice de Theil, se utiliza el logaritmo natural (cuyo valor es e ). a {\displaystyle a} a {\displaystyle a}
  3. ^ Cuando el ingreso de cada individuo es igual al ingreso promedio, i = 1 N ( ( x i x ¯ = 1 ) 1 N ln ( ( x ¯ x i = 1 ) N ) ) {\displaystyle \sum _{i=1}^{N}\left(\left({\frac {x_{i}}{\bar {x}}}=1\right){\frac {1}{N}}\ln \left({\left({\frac {\bar {x}}{x_{i}}}=1\right)N}\right)\right)} = i = 1 N ( 1 N ln ( N ) ) {\displaystyle =\sum _{i=1}^{N}\left({\frac {1}{N}}\ln \left({N}\right)\right)} = ln ( N ) {\displaystyle =\ln \left({N}\right)}

Referencias

  1. ^ Introducción al índice Theil de la Universidad de Texas
  2. ^ "Medidas de segregación". www.urban.org . Urban Institute . Consultado el 5 de febrero de 2018 .
  3. ^ ab Parker, Lauren (20 de julio de 2015). "Segregación racial y étnica: en las noticias y en PolicyMap". PolicyMap . Consultado el 5 de febrero de 2018 .
  4. ^ ab Conceicao, Pedro; Ferreira, Pedro M. (2000). "Guía para jóvenes sobre el índice de Theil: sugerencias de interpretaciones intuitivas y exploración de aplicaciones analíticas". Revista electrónica SSRN . doi :10.2139/ssrn.228703. ISSN  1556-5068. S2CID  19009769.
  5. ^ abc http://www.poorcity.richcity.org (Medidas de redundancia, entropía y desigualdad)
  6. ^ McDonald, James B; Jensen, Bartell C. (diciembre de 1979). "Análisis de algunas propiedades de medidas alternativas de desigualdad de ingresos basadas en la función de distribución gamma". Journal of the American Statistical Association . 74 (368): 856–860. doi :10.1080/01621459.1979.10481042.
  7. ^ "6. Medidas de desigualdad". Manual de pobreza (PDF) . Banco Mundial . 8 de agosto de 2005. pág. 95 . Consultado el 4 de febrero de 2018 .
  8. ^ Novotny, J. (2007). "Sobre la medición de la desigualdad regional: ¿Importa la dimensión espacial de la desigualdad de ingresos?" (PDF) . Annals of Regional Science . 41 (3): 563–580. doi :10.1007/s00168-007-0113-y. S2CID  51753883.
  9. ^ "Inequality Measures". www.urban.org . Urban Institute . Consultado el 5 de febrero de 2018 .
  10. ^ Rajan K. Sampath. Medidas de equidad para la evaluación del rendimiento del riego. Water International, 13(1), 1988.
  11. ^ A. Serebrenik, M. van den Brand. Índice de Theil para la agregación de valores de métricas de software. 26.ª Conferencia Internacional IEEE sobre Mantenimiento de Software. IEEE Computer Society.
  • Software:
    • Calculadora en línea gratuita que calcula el coeficiente de Gini, traza la curva de Lorenz y calcula muchas otras medidas de concentración para cualquier conjunto de datos
    • Calculadora gratuita: scripts en línea y descargables ( Python y Lua ) para las desigualdades de Atkinson, Gini y Hoover
    • Los usuarios del software de análisis de datos R pueden instalar el paquete "ineq" que permite calcular una variedad de índices de desigualdad, incluidos Gini, Atkinson y Theil.
    • Un paquete de desigualdades de MATLAB archivado el 4 de octubre de 2008 en Wayback Machine , que incluye código para calcular los índices de Gini, Atkinson y Theil y para trazar la curva de Lorenz. Hay muchos ejemplos disponibles.
Retrieved from "https://en.wikipedia.org/w/index.php?title=Theil_index&oldid=1255876623"