El índice de Theil es una estadística que se utiliza principalmente para medir la desigualdad económica [1] y otros fenómenos económicos, aunque también se ha utilizado para medir la segregación racial. [2] [3]
La primera presentación de este método de medir la desigualdad se basó en la teoría de la información estadística. Esta presentación original no parecía demasiado intuitiva (como, por ejemplo, proclamó un economista A. Sen). [4] El índice de Theil T T es lo mismo que la redundancia en la teoría de la información, que es la máxima entropía posible de los datos menos la entropía observada. Es un caso especial del índice de entropía generalizado . Puede verse como una medida de redundancia, falta de diversidad, aislamiento, segregación, desigualdad, no aleatoriedad y compresibilidad. Fue propuesto por un econometrista holandés Henri Theil (1924-2000) en elUniversidad Erasmus de Rotterdam . [3]
El propio Henri Theil dijo (1967): "El índice (de Theil) puede interpretarse como el contenido de información esperado del mensaje indirecto que transforma las participaciones de la población como probabilidades previas en participaciones de la renta como probabilidades posteriores". [4]
Un economista y filósofo indio Amartya Sen (* 1933) afirmó sobre el índice de Theil: "Pero el hecho es que el índice de Theil es una fórmula arbitraria, y el promedio de los logaritmos de los recíprocos de la participación del ingreso ponderado por el ingreso no es una medida eso es exactamente rebosante de sentido intuitivo ". [4]
Fórmula
Para una población de N "agentes", cada uno con la característica x , la situación puede representarse mediante la lista x i ( i = 1, ..., N ) donde x i es la característica del agente i . Por ejemplo, si la característica es el ingreso, entonces x i es el ingreso del agente i .
El índice Theil T se define como [5]
y el índice Theil L se define como [5]
dónde es el ingreso medio:
La fórmula de Theil L representa el logaritmo de la media geométrica de la razón: (ingreso medio) / (ingreso i), sobre todos los ingresos incluidos en la suma. ... obviamente un hecho relevante para cualquier rango de ingresos en el mismo lado del ingreso medio. .
... mostrando que esta forma de Theil tiene una justificación obvia, intuitiva, plausible y natural, en lugar de estar justificada en términos de entropía. .
Debido a que una transferencia de un ingreso más grande a uno más pequeño cambiará el índice del ingreso menor más de lo que cambia el índice del ingreso mayor, este índice satisface el principio de transferencia.
Por supuesto, si se desea, se podría incluir un factor de ponderación, como (ingreso medio) / (ingreso i) en los términos de la suma (como en la fórmula de Theil-T anterior, con las razones de ingresos invertidas), para ponderar el índice a favor de contar con más fuerza los cambios en los coeficientes de ingresos en los que el ingreso i difiere del ingreso medio en un factor mayor.
En Theil T, el logaritmo de cada razón de ingresos está ponderado por un factor igual al valor propio de esa razón de ingresos. Y así, si el índice de ingresos es 2, entonces el valor del índice se ve afectado como si hubiera dos de esa persona. ... una ponderación razonable si se considera que la importancia de cada índice de ingresos es proporcional a su propio valor ... el factor por el cual un ingreso particular difiere del ingreso medio.
De manera equivalente, si la situación se caracteriza por una función de distribución discreta f k ( k = 0, ..., W ) donde f k es la fracción de la población con ingresos k y W = Nμ es el ingreso total, entonces y el índice de Theil es:
dónde es de nuevo el ingreso medio:
Tenga en cuenta que, en este caso, el ingreso k es un número entero y k = 1 representa el incremento de ingreso más pequeño posible (por ejemplo, centavos).
si la situación se caracteriza por una función de distribución continua f ( k ) (soportada de 0 a infinito) donde f ( k ) dk es la fracción de la población con ingresos k a k + dk , entonces el índice de Theil es:
donde la media es:
Los índices de Theil para algunas distribuciones de probabilidad continuas comunes se dan en la siguiente tabla:
Función de distribución de ingresos PDF ( x ) ( x ≥ 0) Coeficiente de Theil (nats) Función delta de Dirac 0 Distribución uniforme Distribución exponencial Distribución logarítmica normal Distribución de Pareto (α> 1) Distribución chi-cuadrado Distribución gamma Distribución de Weibull
Si todos tienen el mismo ingreso, entonces T T es igual a 0. Si una persona tiene todos los ingresos, entonces T T da el resultado, que es la máxima desigualdad. Dividiendo T T porpuede normalizar la ecuación para que varíe de 0 a 1, pero luego se viola el axioma de independencia : y no califica como una medida de desigualdad.
El índice de Theil mide una "distancia" entrópica entre la población y el estado igualitario en el que todos tienen los mismos ingresos. El resultado numérico está en términos de entropía negativa, por lo que un número más alto indica más orden que está más lejos de la igualdad completa. Formular el índice para representar entropía negativa en lugar de entropía permite que sea una medida de desigualdad en lugar de igualdad.
Relación con el índice de Atkinson
El índice de Theil se puede transformar en un índice de Atkinson , que tiene un rango entre 0 y 1 (0% y 100%), donde 0 indica igualdad perfecta y 1 (100%) indica máxima desigualdad. (Consulte Índice de entropía generalizada para la transformación).
Derivación de la entropía
El índice de Theil se deriva de la medida de entropía de la información de Shannon . , donde la entropía es una medida de aleatoriedad en un conjunto de información dado. En teoría de la información, física y el índice de Theil, la forma general de entropía es
- dónde
Al observar la distribución del ingreso en una población, es igual a la relación entre el ingreso de un individuo en particular y el ingreso total de toda la población. Esto da la entropía observada de una población a ser:
- dónde
- es el ingreso de un individuo en particular.
- es el ingreso total de toda la población, con
- siendo el número de individuos de la población.
- ("x barra") es el ingreso promedio de la población.
- es el logaritmo natural de: .
El índice de Theil mide qué tan lejos la entropía observada (, que representa cómo se distribuyen los ingresos aleatoriamente) es de la entropía más alta posible (, [nota 3] que representa los ingresos distribuidos al máximo entre los individuos de la población, una distribución análoga al resultado [más probable] de un número infinito de lanzamientos de monedas al azar: una distribución igual de cara y cruz). Por lo tanto, el índice de Theil es la diferencia entre la entropía máxima teórica (que se alcanzaría si los ingresos de cada individuo fueran iguales) menos la entropía observada:
Cuándo está en unidades de población / especie, es una medida de la biodiversidad y se llama índice de Shannon . Si el índice de Theil se usa con x = población / especie, es una medida de desigualdad de población entre un conjunto de especies, o "bioaislamiento" en oposición al "aislamiento de riqueza".
El índice de Theil mide lo que se llama redundancia en la teoría de la información. [5] Es el "espacio de información" sobrante que no se utilizó para transmitir información, lo que reduce la efectividad de la señal de precio . [ investigación original? ] El índice de Theil es una medida de la redundancia de ingresos (u otra medida de riqueza) en algunas personas. La redundancia en algunos individuos implica escasez en otros. Un índice de Theil alto indica que el ingreso total no se distribuye de manera uniforme entre las personas de la misma manera que un archivo de texto sin comprimir no tiene un número similar de ubicaciones de bytes asignadas a los caracteres de bytes únicos disponibles.
Notación | Teoría de la información | Índice de Theil T T |
---|---|---|
número de caracteres únicos | número de individuos | |
un personaje en particular | un individuo en particular | |
recuento del i- ésimo carácter | ingresos de i th individuo | |
caracteres totales en el documento | ingreso total en la población | |
espacio de información no utilizado | potencial no utilizado en el mecanismo de precios [ investigación original? ] | |
compresión de datos | impuesto progresivo [ investigación original? ] |
Descomponibilidad
Según el Banco Mundial ,
"Las medidas de entropía más conocidas son la T de Theil () y la L de Theil (), que permiten descomponer la desigualdad en la parte que se debe a la desigualdad dentro de las áreas (por ejemplo, urbano, rural) y la parte que se debe a las diferencias entre áreas (por ejemplo, la brecha de ingresos rural-urbana). Por lo general, al menos tres cuartas partes de la desigualdad en un país se debe a la desigualdad dentro de un grupo, y la cuarta parte restante a las diferencias entre grupos ". [6]
Si la población se divide en subgrupos y
- es la participación en los ingresos del grupo ,
- es la población total y es la población del grupo ,
- es el índice de Theil para ese subgrupo,
- es el ingreso promedio en el grupo , y
- es el ingreso promedio de la población,
entonces el índice T de Theil es
- por
Por ejemplo, la desigualdad dentro de los Estados Unidos es la desigualdad promedio dentro de cada estado, ponderada por los ingresos estatales, más la desigualdad entre los estados.
- Nota : Esta imagen no es el Índice Theil en cada área de los Estados Unidos, sino las contribuciones al Índice Theil para los EE. UU. Por cada área. El índice Theil es siempre positivo, aunque las contribuciones individuales al índice Theil pueden ser negativas o positivas.
La descomposición del índice de Theil que identifica la proporción atribuible al componente entre regiones se convierte en una herramienta útil para el análisis positivo de la desigualdad regional, ya que sugiere la importancia relativa de la dimensión espacial de la desigualdad. [7]
La T de Theil versus la L de Theil
Tanto la T de Theil como la L de Theil son descomponibles. La diferencia entre ellos se basa en la parte de la distribución de resultados para la que se utiliza cada uno. Los índices de desigualdad en la familia de la entropía generalizada (GE) son más sensibles a las diferencias en la participación del ingreso entre los pobres o entre los ricos, dependiendo de un parámetro que defina el índice GE. Cuanto menor sea el valor del parámetro para GE, más sensible será a las diferencias en la parte inferior de la distribución. [8]
- GE (0) = L de Theil y es más sensible a las diferencias en el extremo inferior de la distribución. También se conoce como la medida de desviación logarítmica media .
- GE (1) = Theil's T y es más sensible a las diferencias en la parte superior de la distribución.
La descomponibilidad es una propiedad del índice de Theil que el coeficiente de Gini más popular no ofrece. El coeficiente de Gini es más intuitivo para muchas personas ya que se basa en la curva de Lorenz . Sin embargo, no se descompone fácilmente como el Theil.
Aplicaciones
Además de multitud de aplicaciones económicas, el índice de Theil se ha aplicado para evaluar el rendimiento de los sistemas de riego [9] y la distribución de métricas de software . [10]
Aplicación en la OCDE
El índice de Theil se utiliza para medir las desigualdades regionales por la OCDE (la Organización para la Cooperación y el Desarrollo Económicos) , mientras que el índice de Theil se define como
dónde es el número de regiones en la OCDE, es la variable de interés en el región (por ejemplo, la esperanza de vida, los ingresos del hogar, la tasa de homicidios, ...) y es la media de la variable de interés dada en todas las regiones.
La interpretación es la siguiente: El índice de Theil oscila entre 0 y , donde cero representa una distribución igual y cualquier otro valor (más alto) representa un nivel más alto de desproporción.
Nota: El índice asigna un peso igual a cada región independientemente de su extensión; por lo tanto, las diferencias en los valores del índice entre países podrían deberse en parte a diferencias en el tamaño promedio de las regiones en cada uno de los países. [11]
Ver también
- Índice de entropía generalizado
- Índice de Atkinson
- coeficiente GINI
- Índice de Hoover
- Métricas de desigualdad de ingresos
- Índice de trajes
- Condensación de riqueza
- Índice de diversidad
Notas
- ^ Cuando esta ecuación se usa en física,representa típicamente la constante de Boltzmann . En teoría de la información o estadística, es típicamente igual a 1 (como en el Índice de Theil).
- ^ En teoría de la información, cuando la información se da en dígitos binarios,se usa el logaritmo binario (conigual a 2). En física y también en el cálculo del índice de Theil, se utiliza el logaritmo natural (conigual ae ).
- ^ Cuando el ingreso de cada individuo es igual al ingreso promedio,
Referencias
- ^ Introducción al índice de Theil de la Universidad de Texas
- ^ "Medidas de segregación" . www.urban.org . Instituto Urbano . Consultado el 5 de febrero de 2018 .
- ^ a b Parker, Lauren (20 de julio de 2015). "Segregación racial y étnica: en las noticias y en PolicyMap" . PolicyMap . Consultado el 5 de febrero de 2018 .
- ^ a b c Conceicao, Pedro NMI2; Ferreira, Pedro M. (2000). "Guía del joven para el índice de Theil: sugiriendo interpretaciones intuitivas y explorando aplicaciones analíticas" . Diario electrónico SSRN . doi : 10.2139 / ssrn.228703 . ISSN 1556-5068 .
- ^ a b c http://www.poorcity.richcity.org (Medidas de redundancia, entropía y desigualdad)
- ^ "6. Medidas de Desigualdad". Manual de pobreza (pdf) . Banco Mundial . 8 de agosto de 2005. p. 95 . Consultado el 4 de febrero de 2018 .
- ^ Novotny, J. (2007). "Sobre la medición de la desigualdad regional: ¿Importa la dimensión espacial de la desigualdad de ingresos?" (PDF) . Anales de ciencia regional . 41 (3): 563–580.
- ^ "Medidas de Desigualdad" . www.urban.org . Instituto Urbano . Consultado el 5 de febrero de 2018 .
- ^ Rajan K. Sampath. Medidas de equidad para la evaluación del desempeño del riego. Water International, 13 (1), 1988.
- ^ A. Serebrenik, M. van den Brand. Índice de Theil para la agregación de valores de métricas de software. 26th IEEE International Conference on Software Maintenance. Sociedad de Informática IEEE.
- ^ "Índices y técnicas de estimación" , OECD Regions and Cities at a Glance 2020 , OECD, 2020-11-30, ISBN 978-92-64-58785-4, consultado el 30 de abril de 2021
enlaces externos
- Software:
- La calculadora en línea gratuita calcula el coeficiente de Gini, traza la curva de Lorenz y calcula muchas otras medidas de concentración para cualquier conjunto de datos
- Calculadora gratuita: scripts en línea y descargables ( Python y Lua ) para las desigualdades de Atkinson, Gini y Hoover
- Los usuarios del software de análisis de datos R pueden instalar el paquete "ineq" que permite el cálculo de una variedad de índices de desigualdad, incluidos Gini, Atkinson, Theil.
- Un paquete de desigualdad de MATLAB , que incluye código para calcular los índices de Gini, Atkinson, Theil y para trazar la curva de Lorenz. Hay muchos ejemplos disponibles.