Mediana


En estadística y teoría de la probabilidad , la mediana es el valor que separa la mitad superior de la mitad inferior de una muestra de datos , una población o una distribución de probabilidad . Para un conjunto de datos , se puede considerar como un valor "medio". La característica básica de la mediana al describir los datos en comparación con la media (a menudo descrita simplemente como el "promedio") es que no está sesgada por una pequeña proporción de valores extremadamente grandes o pequeños y, por lo tanto, proporciona una mejor representación de un "valor típico". " valor. Ingreso medio, por ejemplo, puede ser una mejor manera de sugerir qué es un ingreso "típico", porque la distribución del ingreso puede estar muy sesgada. La mediana es de importancia central en las estadísticas robustas , ya que es la estadística más resistente , con un punto de ruptura del 50%: siempre que no más de la mitad de los datos estén contaminados, la mediana no es un resultado arbitrariamente grande o pequeño.

La mediana de una lista finita de números es el número "medio", cuando esos números se enumeran en orden de menor a mayor.

Si el conjunto de datos tiene un número impar de observaciones, se selecciona el del medio. Por ejemplo, la siguiente lista de siete números,

Si el conjunto de datos tiene un número par de observaciones, no hay un valor medio distinto y la mediana generalmente se define como la media aritmética de los dos valores medios. [1] [2] Por ejemplo, este conjunto de datos de 8 números

tiene un valor mediano de 4.5 , es decir . (En términos más técnicos, esto interpreta la mediana como el rango medio completamente recortado ).

En general, con esta convención, la mediana se puede definir de la siguiente manera: Para un conjunto de datos de elementos, ordenados de menor a mayor,


Encontrar la mediana en conjuntos de datos con un número par e impar de valores
Visualización geométrica de la moda, la mediana y la media de una función de densidad de probabilidad arbitraria [9]
Comparación de la media , la mediana y la moda de dos distribuciones logarítmicas normales con diferente asimetría