La gráfica de probabilidad normal es una técnica gráfica para identificar desviaciones sustanciales de la normalidad . Esto incluye la identificación de valores atípicos , asimetría , curtosis , necesidad de transformaciones y mezclas . Las gráficas de probabilidad normal se componen de datos brutos, residuos de ajustes del modelo y parámetros estimados.
En una gráfica de probabilidad normal (también llamada "gráfica normal"), los datos ordenados se trazan frente a los valores seleccionados para hacer que la imagen resultante parezca una línea recta si los datos están distribuidos aproximadamente normalmente. Las desviaciones de una línea recta sugieren desviaciones de la normalidad. El trazado se puede realizar manualmente utilizando un papel cuadriculado especial , llamado papel de probabilidad normal . Con las computadoras modernas, los gráficos normales se hacen comúnmente con software.
La gráfica de probabilidad normal es un caso especial de la gráfica de probabilidad Q – Q para una distribución normal. Los cuantiles teóricos generalmente se eligen para aproximar la media o la mediana de las estadísticas de orden correspondientes .
Definición [ editar ]
La gráfica de probabilidad normal se forma trazando los datos ordenados frente a una aproximación a las medias o medianas de las estadísticas de orden correspondientes ; ver rankit . Algunos usuarios trazan los datos en el eje vertical; [1] otros trazan los datos en el eje horizontal. [2] [3]
Las diferentes fuentes utilizan aproximaciones ligeramente diferentes para los rangos . La fórmula utilizada por la función "qqnorm" en el paquete básico "stats" en R (lenguaje de programación) es la siguiente:
para i = 1, 2, ..., n , donde
- a = 3/8 si n ≤ 10 y
- 0,5 para n > 10,
y Φ −1 es la función cuantil normal estándar .
Si los datos son consistentes con una muestra de una distribución normal, los puntos deben estar cerca de una línea recta. Como referencia, se puede ajustar una línea recta a los puntos. Cuanto más varíen los puntos de esta línea, mayor será la indicación de desviación de la normalidad. Si la muestra tiene media 0, desviación estándar 1, entonces se podría usar una línea que pase por 0 con pendiente 1.
Con más puntos, las desviaciones aleatorias de una línea serán menos pronunciadas. Las gráficas normales se utilizan a menudo con tan solo 7 puntos, por ejemplo, para representar los efectos en un modelo saturado de un experimento factorial fraccional de 2 niveles . Con menos puntos, se vuelve más difícil distinguir entre variabilidad aleatoria y una desviación sustancial de la normalidad.
Otras distribuciones [ editar ]
Las gráficas de probabilidad para distribuciones distintas de la normal se calculan exactamente de la misma manera. La función cuantil normal Φ −1 simplemente se reemplaza por la función cuantil de la distribución deseada. De esta manera, se puede generar fácilmente una gráfica de probabilidad para cualquier distribución para la que se tenga la función de cuantiles.
Con una familia de distribuciones de escala de ubicación , los parámetros de escala y ubicación de la distribución se pueden estimar a partir de la intersección y la pendiente de la línea. Para otras distribuciones, los parámetros deben estimarse primero antes de poder realizar una gráfica de probabilidad.
Tipos de parcelas [ editar ]
Ésta es una muestra de tamaño 50 de una distribución normal, graficada tanto como un histograma como como una gráfica de probabilidad normal.
Ésta es una muestra de tamaño 50 de una distribución sesgada a la derecha, graficada como un histograma y una gráfica de probabilidad normal.
Ésta es una muestra de tamaño 50 de una distribución uniforme, graficada como un histograma y una gráfica de probabilidad normal.
See also[edit]
- P–P plot
- Q–Q plot
- Rankit
References[edit]
This article incorporates public domain material from the National Institute of Standards and Technology website https://www.nist.gov.
This article includes a list of references, related reading or external links, but its sources remain unclear because it lacks inline citations.July 2011) (Learn how and when to remove this template message) ( |
- ^ e.g., Chambers et al. (1983, ch. 6. Assessing distributional assumptions about data, p. 194)
- ^ Box, George E. P.; Draper, Norman (2007), Response Surfaces, Mixtures, and Ridge Analysis (2nd ed.), Wiley, ISBN 978-0-470-05357-7
- ^ Titterington, D. M.; Smith, A. F. M.; Makov, U. E. (1985), "4. Learning about the parameters of a mixture", Statistical Analysis of Finite Mixture Distributions, Wiley, ISBN 0-471-90763-4
Further reading[edit]
- Chambers, John; William Cleveland; Beat Kleiner; Paul Tukey (1983). Graphical Methods for Data Analysis. Wadsworth.
External links[edit]
Wikimedia Commons has media related to Normal probability plots. |
- Engineering Statistics Handbook: Normal Probability Plot
- Statit Support: Testing for "Near-Normality": The Probability Plot