Gráfica Q-Q


En estadística, una gráfica Q-Q (cuantil-cuantil) es una gráfica de probabilidad, que es un método gráfico para comparar dos distribuciones de probabilidad trazando sus cuantiles entre sí. [1] Primero, se elige el conjunto de intervalos para los cuantiles. Un punto ( x , y ) en el gráfico corresponde a uno de los cuantiles de la segunda distribución ( coordenada y ) trazado contra el mismo cuantil de la primera distribución ( coordenada x ). Así, la línea es una curva paramétrica con el parámetro que es el número del intervalo para el cuantil.

Si las dos distribuciones que se comparan son similares, los puntos en el gráfico Q-Q estarán aproximadamente en la línea y = x . Si las distribuciones están relacionadas linealmente, los puntos en la gráfica Q–Q estarán aproximadamente en una línea, pero no necesariamente en la línea y = x . Los diagramas Q-Q también se pueden usar como un medio gráfico para estimar parámetros en una familia de distribuciones de escala de ubicación .

El gráfico AQ-Q se utiliza para comparar las formas de las distribuciones, proporcionando una vista gráfica de cómo las propiedades como la ubicación , la escala y la asimetría son similares o diferentes en las dos distribuciones. Los diagramas Q-Q se pueden usar para comparar colecciones de datos o distribuciones teóricas . El uso de gráficos Q-Q para comparar dos muestras de datos puede verse como un enfoque no paramétrico para comparar sus distribuciones subyacentes. La gráfica AQ-Q es generalmente un enfoque más poderoso para hacer esto que la técnica común de comparar histogramas de las dos muestras, pero requiere más habilidad para interpretar. Los diagramas Q-Q se usan comúnmente para comparar un conjunto de datos con un modelo teórico. [2][3] Esto puede proporcionar una evaluación de la "bondad de ajuste" que es gráfica, en lugar de reducirse a un resumen numérico. Los gráficos Q-Q también se utilizan para comparar dos distribuciones teóricas entre sí. [4] Dado que los gráficos Q-Q comparan distribuciones, no es necesario que los valores se observen como pares, como en un gráfico de dispersión , o incluso que los números de valores en los dos grupos que se comparan sean iguales.

El término "diagrama de probabilidad" a veces se refiere específicamente a un diagrama Q-Q, a veces a una clase más general de diagramas y, a veces, al diagrama P-P que se usa con menos frecuencia . La gráfica del coeficiente de correlación de la gráfica de probabilidad (gráfica PPCC) es una cantidad derivada de la idea de las gráficas Q-Q, que mide la concordancia de una distribución ajustada con los datos observados y que a veces se utiliza como un medio para ajustar una distribución a los datos.

Una gráfica Q-Q es una gráfica de los cuantiles de dos distribuciones entre sí, o una gráfica basada en estimaciones de los cuantiles. El patrón de puntos en la gráfica se usa para comparar las dos distribuciones.

El paso principal en la construcción de un diagrama Q-Q es calcular o estimar los cuantiles que se van a graficar. Si uno o ambos ejes en un gráfico Q-Q se basan en una distribución teórica con una función de distribución acumulativa (CDF) continua, todos los cuantiles se definen de forma única y se pueden obtener invirtiendo la CDF. Si una distribución de probabilidad teórica con una CDF discontinua es una de las dos distribuciones que se comparan, es posible que algunos de los cuantiles no estén definidos, por lo que se puede trazar un cuantil interpolado. Si la gráfica Q-Q se basa en datos, hay varios estimadores de cuantiles en uso. Las reglas para formar gráficas Q-Q cuando se deben estimar o interpolar los cuantiles se denominan posiciones de gráficas .


Una gráfica Q-Q normal de datos exponenciales estándar independientes generados aleatoriamente , ( X ~ Exp(1) ). Esta gráfica Q-Q compara una muestra de datos en el eje vertical con una población estadística en el eje horizontal. Los puntos siguen un patrón fuertemente no lineal, lo que sugiere que los datos no se distribuyen como una normal estándar ( X ~ N(0,1) ). El desplazamiento entre la línea y los puntos sugiere que la media de los datos no es 0. Se puede determinar que la mediana de los puntos está cerca de 0,7
Una gráfica Q-Q normal que compara datos normales estándar independientes generados aleatoriamente en el eje vertical con una población normal estándar en el eje horizontal. La linealidad de los puntos sugiere que los datos se distribuyen normalmente.
Gráfica AQ-Q de una muestra de datos frente a una distribución de Weibull . Los deciles de las distribuciones se muestran en rojo. Tres valores atípicos son evidentes en el extremo superior del rango. De lo contrario, los datos se ajustan bien al modelo de Weibull(1,2).
Gráfica AQ-Q que compara las distribuciones de temperaturas máximas diarias estandarizadas en 25 estaciones en el estado estadounidense de Ohio en marzo y julio. El patrón curvo sugiere que los cuantiles centrales están más juntos en julio que en marzo, y que la distribución de julio está sesgada hacia la izquierda en comparación con la distribución de marzo. Los datos cubren el período 1893-2001.
Gráfica Q-Q para las primeras fechas de apertura/cierre final de la ruta 20 del estado de Washington , frente a una distribución normal. [5] Los valores atípicos son visibles en la esquina superior derecha.