Gráfico de probabilidad normal

La gráfica de probabilidad normal es una técnica gráfica para identificar desviaciones sustanciales de la normalidad . Esto incluye la identificación de valores atípicos , asimetría , curtosis , necesidad de transformaciones y mezclas . Las gráficas de probabilidad normal se componen de datos brutos, residuos de ajustes del modelo y parámetros estimados.

Una gráfica de probabilidad normal

En una gráfica de probabilidad normal (también llamada "gráfica normal"), los datos ordenados se trazan frente a los valores seleccionados para hacer que la imagen resultante parezca una línea recta si los datos están distribuidos aproximadamente normalmente. Las desviaciones de una línea recta sugieren desviaciones de la normalidad. El trazado se puede realizar manualmente utilizando un papel cuadriculado especial , llamado papel de probabilidad normal . Con las computadoras modernas, los gráficos normales se hacen comúnmente con software.

La gráfica de probabilidad normal es un caso especial de la gráfica de probabilidad Q – Q para una distribución normal. Los cuantiles teóricos generalmente se eligen para aproximar la media o la mediana de las estadísticas de orden correspondientes .

Definición [ editar ]

La gráfica de probabilidad normal se forma trazando los datos ordenados frente a una aproximación a las medias o medianas de las estadísticas de orden correspondientes ; ver rankit . Algunos usuarios trazan los datos en el eje vertical; ^[1] otros trazan los datos en el eje horizontal. ^[2]^[3]

Las diferentes fuentes utilizan aproximaciones ligeramente diferentes para los rangos . La fórmula utilizada por la función "qqnorm" en el paquete básico "stats" en R (lenguaje de programación) es la siguiente:

z_{i}=\Phi ^{-1}\left({\frac {i-a}{n+1-2a}}\right),

para $i = 1, 2, ..., n$ , donde

a = 3/8

si

n \leq 10

y

0,5 para n > 10,

y $Φ -1$ es la función cuantil normal estándar .

Si los datos son consistentes con una muestra de una distribución normal, los puntos deben estar cerca de una línea recta. Como referencia, se puede ajustar una línea recta a los puntos. Cuanto más varíen los puntos de esta línea, mayor será la indicación de desviación de la normalidad. Si la muestra tiene media 0, desviación estándar 1, entonces se podría usar una línea que pase por 0 con pendiente 1.

Con más puntos, las desviaciones aleatorias de una línea serán menos pronunciadas. Las gráficas normales se utilizan a menudo con tan solo 7 puntos, por ejemplo, para representar los efectos en un modelo saturado de un experimento factorial fraccional de 2 niveles . Con menos puntos, se vuelve más difícil distinguir entre variabilidad aleatoria y una desviación sustancial de la normalidad.

Otras distribuciones [ editar ]

Las gráficas de probabilidad para distribuciones distintas de la normal se calculan exactamente de la misma manera. La función cuantil normal $Φ -1$ simplemente se reemplaza por la función cuantil de la distribución deseada. De esta manera, se puede generar fácilmente una gráfica de probabilidad para cualquier distribución para la que se tenga la función de cuantiles.

Con una familia de distribuciones de escala de ubicación , los parámetros de escala y ubicación de la distribución se pueden estimar a partir de la intersección y la pendiente de la línea. Para otras distribuciones, los parámetros deben estimarse primero antes de poder realizar una gráfica de probabilidad.

Tipos de parcelas [ editar ]

Ésta es una muestra de tamaño 50 de una distribución normal, graficada tanto como un histograma como como una gráfica de probabilidad normal.

Gráfica de probabilidad normal de una muestra de una distribución normal: parece bastante recta, al menos cuando se ignoran los pocos valores grandes y pequeños.
Histograma de una muestra de una distribución normal: parece bastante simétrica y unimodal

Ésta es una muestra de tamaño 50 de una distribución sesgada a la derecha, graficada como un histograma y una gráfica de probabilidad normal.

Gráfico de probabilidad normal de una muestra de una distribución sesgada a la derecha: tiene una forma de C invertida.
Histograma de una muestra de una distribución sesgada a la derecha: parece unimodal y sesgada a la derecha.

Ésta es una muestra de tamaño 50 de una distribución uniforme, graficada como un histograma y una gráfica de probabilidad normal.

Normal probability plot of a sample from a uniform distribution – it has an S shape.
Histogram of a sample from a uniform distribution – it looks multimodal and supposedly roughly symmetric.

References[edit]

This article incorporates public domain material from the National Institute of Standards and Technology website https://www.nist.gov.

This article includes a list of references, related reading or external links, but its sources remain unclear because it lacks inline citations. Please help to improve this article by introducing more precise citations. (July 2011) (Learn how and when to remove this template message)

^ e.g., Chambers et al. (1983, ch. 6. Assessing distributional assumptions about data, p. 194)
^ Box, George E. P.; Draper, Norman (2007), Response Surfaces, Mixtures, and Ridge Analysis (2nd ed.), Wiley, ISBN 978-0-470-05357-7
^ Titterington, D. M.; Smith, A. F. M.; Makov, U. E. (1985), "4. Learning about the parameters of a mixture", Statistical Analysis of Finite Mixture Distributions, Wiley, ISBN 0-471-90763-4

External links[edit]

Wikimedia Commons has media related to Normal probability plots.

Engineering Statistics Handbook: Normal Probability Plot
Statit Support: Testing for "Near-Normality": The Probability Plot

[1] .g., Chambers et al. (1983, ch. 6. Assessing distributional assumptions about data, p. 194)

[2] Box, George E. P.; Draper, Norman (2007), Response Surfaces, Mixtures, and Ridge Analysis (2nd ed.), Wiley, ISBN 978-0-470-05357-7

[3] Titterington, D. M.; Smith, A. F. M.; Makov, U. E. (1985), "4. Learning about the parameters of a mixture", Statistical Analysis of Finite Mixture Distributions, Wiley, ISBN 0-471-90763-4

[1]

vteDistribution fitting
Overview and methods	Probability plot Normal probability plot P–P plot Q–Q plot Plotting position L-moment Distribution fitting Cumulative frequency analysis
Software	CumFreq MathWorks R StatSoft

Gráfico de probabilidad normal

Contenido

Definición [ editar ]

Otras distribuciones [ editar ]

Tipos de parcelas [ editar ]

See also[edit]

References[edit]

Further reading[edit]

External links[edit]