De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

La gráfica de probabilidad normal es una técnica gráfica para identificar desviaciones sustanciales de la normalidad . Esto incluye la identificación de valores atípicos , asimetría , curtosis , necesidad de transformaciones y mezclas . Las gráficas de probabilidad normal se componen de datos brutos, residuos de ajustes del modelo y parámetros estimados.

Una gráfica de probabilidad normal

En una gráfica de probabilidad normal (también llamada "gráfica normal"), los datos ordenados se trazan frente a los valores seleccionados para hacer que la imagen resultante parezca una línea recta si los datos están distribuidos aproximadamente normalmente. Las desviaciones de una línea recta sugieren desviaciones de la normalidad. El trazado se puede realizar manualmente utilizando un papel cuadriculado especial , llamado papel de probabilidad normal . Con las computadoras modernas, los gráficos normales se hacen comúnmente con software.

La gráfica de probabilidad normal es un caso especial de la gráfica de probabilidad Q – Q para una distribución normal. Los cuantiles teóricos generalmente se eligen para aproximar la media o la mediana de las estadísticas de orden correspondientes .

Definición [ editar ]

La gráfica de probabilidad normal se forma trazando los datos ordenados frente a una aproximación a las medias o medianas de las estadísticas de orden correspondientes ; ver rankit . Algunos usuarios trazan los datos en el eje vertical; [1] otros trazan los datos en el eje horizontal. [2] [3]

Las diferentes fuentes utilizan aproximaciones ligeramente diferentes para los rangos . La fórmula utilizada por la función "qqnorm" en el paquete básico "stats" en R (lenguaje de programación) es la siguiente:

para i = 1, 2, ..., n , donde

a = 3/8 si n  ≤ 10 y
0,5 para n  > 10,

y Φ −1 es la función cuantil normal estándar .

Si los datos son consistentes con una muestra de una distribución normal, los puntos deben estar cerca de una línea recta. Como referencia, se puede ajustar una línea recta a los puntos. Cuanto más varíen los puntos de esta línea, mayor será la indicación de desviación de la normalidad. Si la muestra tiene media 0, desviación estándar 1, entonces se podría usar una línea que pase por 0 con pendiente 1.

Con más puntos, las desviaciones aleatorias de una línea serán menos pronunciadas. Las gráficas normales se utilizan a menudo con tan solo 7 puntos, por ejemplo, para representar los efectos en un modelo saturado de un experimento factorial fraccional de 2 niveles . Con menos puntos, se vuelve más difícil distinguir entre variabilidad aleatoria y una desviación sustancial de la normalidad.

Otras distribuciones [ editar ]

Las gráficas de probabilidad para distribuciones distintas de la normal se calculan exactamente de la misma manera. La función cuantil normal Φ −1 simplemente se reemplaza por la función cuantil de la distribución deseada. De esta manera, se puede generar fácilmente una gráfica de probabilidad para cualquier distribución para la que se tenga la función de cuantiles.

Con una familia de distribuciones de escala de ubicación , los parámetros de escala y ubicación de la distribución se pueden estimar a partir de la intersección y la pendiente de la línea. Para otras distribuciones, los parámetros deben estimarse primero antes de poder realizar una gráfica de probabilidad.

Tipos de parcelas [ editar ]

Ésta es una muestra de tamaño 50 de una distribución normal, graficada tanto como un histograma como como una gráfica de probabilidad normal.

  • Gráfica de probabilidad normal de una muestra de una distribución normal: parece bastante recta, al menos cuando se ignoran los pocos valores grandes y pequeños.

  • Histograma de una muestra de una distribución normal: parece bastante simétrica y unimodal

Ésta es una muestra de tamaño 50 de una distribución sesgada a la derecha, graficada como un histograma y una gráfica de probabilidad normal.

  • Gráfico de probabilidad normal de una muestra de una distribución sesgada a la derecha: tiene una forma de C invertida.

  • Histograma de una muestra de una distribución sesgada a la derecha: parece unimodal y sesgada a la derecha.

Ésta es una muestra de tamaño 50 de una distribución uniforme, graficada como un histograma y una gráfica de probabilidad normal.

  • Normal probability plot of a sample from a uniform distribution – it has an S shape.

  • Histogram of a sample from a uniform distribution – it looks multimodal and supposedly roughly symmetric.

See also[edit]

References[edit]

 This article incorporates public domain material from the National Institute of Standards and Technology website https://www.nist.gov.

  1. ^ e.g., Chambers et al. (1983, ch. 6. Assessing distributional assumptions about data, p. 194)
  2. ^ Box, George E. P.; Draper, Norman (2007), Response Surfaces, Mixtures, and Ridge Analysis (2nd ed.), Wiley, ISBN 978-0-470-05357-7
  3. ^ Titterington, D. M.; Smith, A. F. M.; Makov, U. E. (1985), "4. Learning about the parameters of a mixture", Statistical Analysis of Finite Mixture Distributions, Wiley, ISBN 0-471-90763-4

Further reading[edit]

  • Chambers, John; William Cleveland; Beat Kleiner; Paul Tukey (1983). Graphical Methods for Data Analysis. Wadsworth.

External links[edit]

  • Engineering Statistics Handbook: Normal Probability Plot
  • Statit Support: Testing for "Near-Normality": The Probability Plot