La interpolación de Pareto es un método para estimar la mediana y otras propiedades de una población que sigue una distribución de Pareto . Se utiliza en economía cuando se analiza la distribución de ingresos en una población, cuando se deben basar las estimaciones en una muestra aleatoria relativamente pequeña tomada de la población.
La familia de distribuciones de Pareto está parametrizada por
- un número positivo κ que es el valor más pequeño que puede tomar una variable aleatoria con una distribución de Pareto. Aplicado a la distribución de ingresos, κ es el ingreso más bajo de cualquier persona de la población; y
- un número positivo θ el "índice de Pareto"; a medida que aumenta, la cola de la distribución se vuelve más delgada. Aplicado a la distribución de ingresos, esto significa que cuanto mayor es el valor del índice de Pareto θ, menor es la proporción de ingresos muchas veces mayor que los ingresos más pequeños.
La interpolación de Pareto se puede utilizar cuando la información disponible incluye la proporción de la muestra que cae por debajo de cada uno de los dos números especificados a < b . Por ejemplo, se puede observar que el 45% de los individuos de la muestra tienen ingresos por debajo de a = $ 35,000 por año, y el 55% tiene ingresos por debajo de b = $ 40,000 por año.
Dejar
- P a = proporción de la muestra que se encuentra debajo de a ;
- P b = proporción de la muestra que se encuentra debajo de b .
Entonces las estimaciones de κ y θ son
y
La estimación de la mediana sería entonces
ya que la mediana de la población real es
Referencias
- Oficina del Censo de EE. UU., Memorando sobre técnicas estadísticas utilizadas en la encuesta de ingresos de 2001 (PDF) . Consulte la ecuación 10 en la pág. 24.
- Stults, Brian J, Derivación del ingreso familiar medio . Da una derivación de las ecuaciones para la interpolación de Pareto.