En estadística descriptiva , el resumen de siete números es una colección de siete estadísticas de resumen y es una extensión del resumen de cinco números . Hay dos formas comunes similares.
Al igual que con el resumen de cinco números, se puede representar mediante un diagrama de caja modificado , agregando marcas de sombreado en los "bigotes" para dos de los números adicionales.
Resumen de siete números
Los siguientes percentiles están espaciados (aproximadamente) uniformemente bajo una variable distribuida normalmente :
- el segundo percentil (mejor: 2,15%)
- el percentil 9 (mejor: 8,87%)
- el percentil 25 o el cuartil inferior o el primer cuartil
- el percentil 50 o mediana (valor medio o segundo cuartil )
- el percentil 75 o el cuartil superior o el tercer cuartil
- el percentil 91 (mejor: 91,13%)
- el percentil 98 (mejor: 97,85%)
Los tres valores del medio, el cuartil inferior , la mediana y el cuartil superior , son las estadísticas habituales del resumen de cinco números y son los valores estándar para el cuadro en un diagrama de cuadro .
Los dos percentiles inusuales en cada extremo se utilizan porque las ubicaciones de los siete valores estarán aproximadamente igualmente espaciadas si los datos se distribuyen normalmente [a] Algunas pruebas estadísticas requieren datos distribuidos normalmente , por lo que los valores trazados proporcionan una verificación visual conveniente para la validez de pruebas posteriores, simplemente escaneando para ver si las marcas de esos siete percentiles parecen estar a distancias iguales en el gráfico.
Tenga en cuenta que mientras que los valores extremos del resumen de cinco números dependen del número de muestras, este resumen de siete números no lo hace, y es algo más estable, ya que sus extremos de bigotes están protegidos de las oscilaciones salvajes habituales en los valores extremos de la muestra reemplazándolos con los percentiles 2 y 98 más estables.
Los valores se pueden representar mediante un diagrama de caja modificado . Los percentiles 2 y 98 están representados por los extremos de los bigotes, y las marcas de trama a lo largo de los bigotes marcan los percentiles 9 y 91.
Resumen de siete cifras de Bowley
Arthur Bowley utilizó un conjunto de estadísticas no paramétricas , llamado "resumen de siete cifras", que incluye los extremos, deciles y cuartiles , junto con la mediana. [1]
Entonces los números son:
- el mínimo de la muestra
- el percentil 10 (primer decil )
- el percentil 25 o el cuartil inferior o el primer cuartil
- el percentil 50 o mediana (valor medio o segundo cuartil )
- el percentil 75 o el cuartil superior o el tercer cuartil
- el percentil 90 (último decil )
- el máximo de la muestra
Tenga en cuenta que los cinco del medio de los siete números son casi los mismos que para el resumen de siete números anterior.
La suma de los deciles permite calcular el rango interdecil , que para una distribución normal se puede escalar para dar una estimación razonablemente eficiente de la desviación estándar, y el resumen medio del 10% , que cuando se compara con la mediana da una idea de la asimetría en las colas.
Ver también
Notas al pie
- ^ Los siete percentiles igualmente espaciados con tres dígitos de precisión son 2,15%, 8,87%, 25,0%, 50,0%, 75,0%, 91,13% y 97,85%.
Referencias
- ^ Bowley, Arthur (1920). Manual elemental de estadística (3ª ed.). pag. 62 .
las siete posiciones son el máximo y mínimo, mediana, cuartiles y dos deciles