En estadística , una mediana ponderada de una muestra es el percentil ponderado del 50% . [1] [2] [3] Fue propuesto por primera vez por FY Edgeworth en 1888. [4] [5] Al igual que la mediana, es útil como estimador de tendencia central , robusto frente a valores atípicos . Permite ponderaciones estadísticas no uniformes relacionadas, por ejemplo, con medidas de precisión variables en la muestra.
Definición
Caso general
Para elementos ordenados distintos con pesos positivos tal que , la mediana ponderada es el elemento satisfactorio
- y
Caso especial
Considere un conjunto de elementos en el que dos de los elementos satisfacen el caso general. Esto ocurre cuando los pesos respectivos de ambos elementos bordean el punto medio del conjunto de pesos sin encapsularlo; Más bien, cada elemento define una partición igual a. Estos elementos se denominan mediana ponderada inferior y mediana ponderada superior. Sus condiciones se satisfacen de la siguiente manera:
Mediana ponderada más baja
- y
Mediana ponderada superior
- y
Idealmente, se crearía un nuevo elemento utilizando la media de las medianas ponderadas superior e inferior y se le asignará un peso de cero. Este método es similar a encontrar la mediana de un conjunto par. El nuevo elemento sería una verdadera mediana ya que la suma de los pesos a cada lado de este punto de partición sería igual.
Dependiendo de la aplicación, puede que no sea posible o prudente crear nuevos datos. En este caso, la mediana ponderada debe elegirse en función de qué elemento mantiene las particiones más iguales. Esta será siempre la mediana ponderada con el menor peso.
En el caso de que las medianas ponderadas superior e inferior sean iguales, la mediana ponderada inferior es generalmente aceptada como lo propuso originalmente Edgeworth. [6]
Propiedades
La suma de pesos en cada una de las dos particiones debe ser lo más igual posible.
Si los pesos de todos los números del conjunto son iguales, entonces la mediana ponderada se reduce a la mediana .
Ejemplos de
Para simplificar, considere el conjunto de números con cada número teniendo pesos respectivamente. La mediana es 3 y la mediana ponderada es el elemento correspondiente al peso 0.3, que es 4. Los pesos en cada lado del pivote suman 0.45 y 0.25, cumpliendo la condición general de que cada lado sea lo más uniforme posible. Cualquier otro peso resultaría en una mayor diferencia entre cada lado del pivote.
Considere el conjunto de números teniendo cada número pesos uniformes respectivamente. Las ponderaciones iguales deberían dar como resultado una mediana ponderada igual a la mediana. Esta mediana es 2.5 ya que es un conjunto par. La mediana ponderada inferior es 2 con sumas de partición de 0,25 y 0,5, y la mediana ponderada superior es 3 con sumas de partición de 0,5 y 0,25. Cada una de estas particiones satisface su respectiva condición especial y la condición general. Es ideal introducir un nuevo pivote tomando la media de las medianas ponderadas superior e inferior cuando existen. Con esto, el conjunto de números es con cada número teniendo pesos respectivamente. Esto crea particiones que suman 0,5. Puede verse fácilmente que la mediana ponderada y la mediana son las mismas para cualquier conjunto de tamaño con pesos iguales.
Del mismo modo, considere el conjunto de números con cada número teniendo pesos respectivamente. La mediana ponderada inferior es 2 con sumas de partición de 0,49 y 0,5, y la mediana ponderada superior es 3 con sumas de partición de 0,5 y 0,25. En el caso de trabajar con números enteros o medidas que no sean de intervalo , la mediana ponderada más baja sería aceptada ya que es el peso más bajo del par y por lo tanto mantiene las particiones más iguales. Sin embargo, es más ideal tomar la media de estas medianas ponderadas cuando tiene sentido. Casualmente, tanto la mediana ponderada como la mediana son iguales a 2.5, pero esto no siempre será válido para conjuntos más grandes dependiendo de la distribución del peso.
Algoritmo
La mediana ponderada se puede calcular ordenando el conjunto de números y encontrando los números más pequeños que sumen la mitad del peso total. Este algoritmo tomahora. Existe un mejor enfoque para encontrar la mediana ponderada mediante un algoritmo de selección modificado. [1]
// La llamada principal es WeightedMedian (a, 1, n) // Devuelve la mediana inferior WeightedMedian ( a [ 1 .. n ] , p , r ) // Caso base para un solo elemento si r = p, luego devuelve a [ p ] / / Caso base para dos elementos // Asegúrese de devolver el promedio, en caso de que los dos candidatos tengan el mismo peso si r - p = 1 entonces si a [ p ] . w == a [ r ] . w return ( a [ p ] + a [ r ]) / 2 si a [ p ] . w > a [ r ] . w return a [ p ] else return a [ r ] // Partición alrededor del pivote r q = partición ( a , p , r ) wl , wg = suma de pesos de particiones ( p , q - 1 ) , ( q + 1 , r ) // Si particiones se equilibran entonces estamos hecho si wl y WG tanto < 1 / 2 a continuación, volver a [ q ] demás // peso pivote Aumentar por la cantidad de partición eliminamos si wl > wg entonces un [ q ] . w + = wg // Recurse en pivote inclusive WeightedMedian ( a , p , q ) else a [ q ] . w + = wl Mediana ponderada ( a , q , r )
Software / código fuente
- Un algoritmo de mediana ponderado rápido se implementa en una extensión C para Python en el paquete Robustats Python .
- R tiene muchas implementaciones, entre ellos
matrixStats::weightedMedian()
,spatstat::weighted.median()
y otros. [7]
Ver también
Referencias
- ^ a b Cormen, Thomas H .; Leiserson, Charles E .; Rivest, Ronald L .; Stein, Clifford (2001). Introducción a los algoritmos . ISBN 9780262032933.
- ^ Horowitz, Ellis; Sahni, Sartaj; Rajasekaran, Sanguthevar (15 de diciembre de 1996). Algoritmos informáticos C ++: versiones de C ++ y pseudocódigo . ISBN 9780716783152.
- ^ Bovik, Alan C (21 de julio de 2010). Manual de procesamiento de imágenes y videos . ISBN 9780080533612.
- ^ Edgeworth, año fiscal (1888). "Sobre un nuevo método de reducción de las observaciones relativas a varias cantidades" . Revista Filosófica . 25 (154): 184-191. doi : 10.1080 / 14786448808628170 .
- ^ Edgeworth, año fiscal (1887). "Sobre observaciones relativas a varias cantidades". Hermathena . Trinity College de Dublín. 6 (13): 279-285. JSTOR 23036355 .
- ^ Lange, Kenneth (15 de junio de 2010). Análisis numérico para estadísticos (segunda ed.). Saltador. pag. 313. ISBN 978-1-4419-5944-7.
- ^ ¿Existe una función ponderada.median ()?