Gráfico P – P

En estadística, una gráfica P – P ( gráfica de probabilidad-probabilidad o gráfica de porcentaje-porcentaje o gráfica de valor P ) es una gráfica de probabilidad para evaluar qué tan cerca están de acuerdo dos conjuntos de datos , que grafica las dos funciones de distribución acumuladas entre sí. Los gráficos de PP se utilizan ampliamente para evaluar la asimetría de una distribución.

La gráfica Q – Q se usa más ampliamente, pero ambas se conocen como "la" gráfica de probabilidad y son potencialmente confusas.

Definición

La gráfica AP – P traza dos funciones de distribución acumulativa (CDF) entre sí: ^[1] dadas dos distribuciones de probabilidad, con las CDF " F " y " G ", representa ${\ Displaystyle (F (z), G (z))}$ ya que z varía de ${\ Displaystyle - \ infty}$ a ${\ Displaystyle \ infty.}$ Como un CDF tiene un rango [0,1], el dominio de este gráfico paramétrico es ${\ Displaystyle (- \ infty, \ infty)}$ y el rango es el cuadrado unitario ${\ Displaystyle [0,1] \ times [0,1].}$

Por lo tanto, para la entrada z, la salida es el par de números que dan qué porcentaje de f y qué porcentaje de g caen en o por debajo de z.

La línea de comparación es la línea de 45 ° desde (0,0) a (1,1) - las distribuciones son iguales si y solo si la gráfica cae en esta línea - cualquier desviación indica una diferencia entre las distribuciones. ^[2]

Ejemplo

Como ejemplo, si las dos distribuciones no se superponen, digamos que F está por debajo de G, entonces la gráfica P – P se moverá de izquierda a derecha a lo largo de la parte inferior del cuadrado, a medida que z se mueve a través del soporte de F, la CDF de F va de 0 a 1, mientras que la CDF de G permanece en 0 - y luego se mueve hacia arriba por el lado derecho del cuadrado - la CDF de F ahora es 1, ya que todos los puntos de F se encuentran debajo de todos los puntos de G, y ahora la CDF de G se mueve de 0 a 1 a medida que z se mueve a través del soporte de G. (se necesita una gráfica para este párrafo)

Usar

Como ilustra el ejemplo anterior, si dos distribuciones están separadas en el espacio, la gráfica P – P proporcionará muy pocos datos; solo es útil para comparar distribuciones de probabilidad que tienen una ubicación cercana o igual. En particular, pasará por el punto (1/2, 1/2) si y solo si las dos distribuciones tienen la misma mediana .

Las gráficas P – P a veces se limitan a comparaciones entre dos muestras, en lugar de comparar una muestra con una distribución de modelo teórico. ^[3] Sin embargo, son de uso general, particularmente cuando las observaciones no se modelan todas con la misma distribución.

Sin embargo, ha encontrado algún uso en la comparación de una distribución de muestra de una distribución teórica conocida : dadas n muestras, trazar la CDF teórica continua contra la CDF empírica daría como resultado un escalón (un paso cuando z golpea una muestra) y llegaría a la cima. del cuadrado cuando se alcanzó el último punto de datos. En su lugar, solo se grafican los puntos, trazando los k- ésimos puntos observados (en orden: formalmente el estadístico de k- ésimo orden observado ) contra el cuantil k / ( n + 1) de la distribución teórica. ^[3] Esta elección de la "posición de trazado" (elección del cuantil de la distribución teórica) ha ocasionado menos controversia que la elección de los gráficos Q – Q. La bondad de ajuste resultante de la línea de 45 ° da una medida de la diferencia entre un conjunto de muestra y la distribución teórica.

La gráfica AP – P se puede utilizar como un complemento gráfico de las pruebas de ajuste de distribuciones de probabilidad, ^[4]^[5] con líneas adicionales que se incluyen en la gráfica para indicar regiones de aceptación específicas o el rango de desviación esperada del 1 : 1 línea. Se encuentra disponible una versión mejorada de la gráfica P – P, llamada gráfica SP o S – P, ^[4]^[5] que hace uso de una transformación estabilizadora de la varianza para crear una gráfica en la que las variaciones sobre el 1: 1 La línea debe ser la misma en todas las ubicaciones.

Ver también

Gráfico de probabilidad

Referencias

Citas

^ Inferencia estadística no paramétrica de Jean Dickinson Gibbons , Subhabrata Chakraborti, cuarta edición, CRC Press, 2003, ISBN 978-0-8247-4052-8 , p. 145
^ Derrick, B; Al rebaño; Blanco, P (2016). "Por qué la prueba de Welchs es robusta ante errores de tipo I" . Los métodos cuantitativos para la psicología . 12 (1): 30–38. doi : 10.20982 / tqmp.12.1.p030 .
^ ^a ^b Prueba de normalidad , por Henry C. Thode, CRC Press, 2002, ISBN 978-0-8247-9613-6 , Sección 2.2.3, Gráficos de porcentaje-porcentaje, p. 23
^ ^a ^b Michael JR (1983) "La trama de probabilidad estabilizada". Biometrika , 70 (1), 11-17. JSTOR 2335939
^ ^a ^b Shorack, GR, Wellner, JA (1986) Procesos empíricos con aplicaciones a la estadística , Wiley. ISBN 0-471-86725-X p248–250

Fuentes

Davidson, Russell; MacKinnon, James (enero de 1998). "Métodos gráficos para investigar el tamaño y el poder de las pruebas de hipótesis". La escuela de Manchester . 66 (1): 1–26. CiteSeerX 10.1.1.57.4335 . doi : 10.1111 / 1467-9957.00086 .

[1] Inferencia estadística no paramétrica de Jean Dickinson Gibbons , Subhabrata Chakraborti, cuarta edición, CRC Press, 2003, ISBN 978-0-8247-4052-8 , p. 145

[2] Derrick, B; Al rebaño; Blanco, P (2016). "Por qué la prueba de Welchs es robusta ante errores de tipo I" . Los métodos cuantitativos para la psicología . 12 (1): 30–38. doi : 10.20982 / tqmp.12.1.p030 .

[thode223-3] Prueba de normalidad , por Henry C. Thode, CRC Press, 2002, ISBN 978-0-8247-9613-6 , Sección 2.2.3, Gráficos de porcentaje-porcentaje, p. 23

[Michael-4] Michael JR (1983) "La trama de probabilidad estabilizada". Biometrika , 70 (1), 11-17. JSTOR 2335939

[Shorack-5] Shorack, GR, Wellner, JA (1986) Procesos empíricos con aplicaciones a la estadística , Wiley. ISBN 0-471-86725-X p248–250

[1]