De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda
Hipótesis-nula-reigon-eng.png

Una prueba Z es cualquier prueba estadística para la cual la distribución del estadístico de prueba bajo la hipótesis nula puede aproximarse mediante una distribución normal . La prueba Z prueba la media de una distribución. Para cada nivel de significación en el intervalo de confianza , la Z -test tiene un único valor crítico (por ejemplo, 1,96 para el 5% de dos colas), que hace que sea más conveniente que el de Student t -test cuyos valores críticos se definen por el tamaño de la muestra ( a través de los grados de libertad correspondientes ).

Debido al teorema del límite central , muchas estadísticas de prueba se distribuyen aproximadamente normalmente para muestras grandes. Por lo tanto, muchas pruebas estadísticas se pueden realizar convenientemente como pruebas Z aproximadas si el tamaño de la muestra es grande o se conoce la varianza de la población. Si se desconoce la varianza de la población (y, por lo tanto, debe estimarse a partir de la propia muestra) y el tamaño de la muestra no es grande ( n <30), la prueba t de Student puede ser más apropiada.

Cómo realizar una prueba Z cuando T es un estadístico que se distribuye aproximadamente normalmente bajo la hipótesis nula es el siguiente:

En primer lugar, estimar el valor esperado μ de T bajo la hipótesis nula, y obtener una estimación s de la desviación estándar de la T .

En segundo lugar, determine las propiedades de T  : una cola o dos colas.

Para la hipótesis nula H 0 : μ≥μ 0 frente a la hipótesis alternativa H 1 : μ <μ 0 , es superior / de cola derecha (una cola).

Para la hipótesis nula H 0 : μ≤μ 0 frente a la hipótesis alternativa H 1 : μ> μ 0 , es inferior / de cola izquierda (una cola).

Para la hipótesis nula H 0 : μ = μ 0 frente a la hipótesis alternativa H 1 : μ ≠ μ 0 , tiene dos colas.

En tercer lugar, calcule la puntuación estándar  :

,

cuyos valores p de una cola y de dos colas se pueden calcular como Φ ( Z ) (para pruebas de cola superior / derecha), Φ (- Z ) (para pruebas de cola inferior / izquierda) y 2Φ (- | Z | ) (para pruebas de dos colas) donde Φ es la función de distribución acumulativa normal estándar .

Usar en pruebas de ubicación [ editar ]

  1. El término " prueba Z " se usa a menudo para referirse específicamente a la prueba de ubicación de una muestra que compara la media de un conjunto de medidas con una constante dada cuando se conoce la varianza de la muestra. Por ejemplo, si los datos observados X 1 , ..., X n son (i) independientes, (ii) tienen una media común μ, y (iii) tienen una varianza común σ 2 , entonces el promedio de la muestra X tiene una media μ y varianza .
  2. La hipótesis nula es que el valor medio de X es un número dado μ 0 . Podemos usar X   como un estadístico de prueba, rechazando la hipótesis nula si X  - μ 0 es grande.
  3. Para calcular la estadística estandarizada , necesitamos saber o tener un valor aproximado para σ 2 , a partir del cual podemos calcular . En algunas aplicaciones, se conoce σ 2 , pero esto es poco común.
  4. Si el tamaño de la muestra es moderado o grande, podemos sustituir la varianza de la muestra por σ 2 , dando una prueba complementaria . La prueba resultante no será una prueba Z exacta ya que no se tiene en cuenta la incertidumbre en la varianza de la muestra; sin embargo, será una buena aproximación a menos que el tamaño de la muestra sea pequeño.
  5. Se puede utilizar una prueba t para tener en cuenta la incertidumbre en la varianza de la muestra cuando los datos son exactamente normales .
  6. Diferencia entre la prueba Z y la prueba t: la prueba Z se usa cuando el tamaño de la muestra es grande (n> 50) o se conoce la varianza de la población. La prueba t se utiliza cuando el tamaño de la muestra es pequeño (n <50) y se desconoce la varianza de la población.
  7. No existe una constante universal en la que el tamaño de la muestra se considere generalmente lo suficientemente grande como para justificar el uso de la prueba complementaria. Reglas generales típicas: el tamaño de la muestra debe ser de 50 observaciones o más.
  8. Para tamaños de muestra grandes, el procedimiento de prueba t da valores p casi idénticos a los del procedimiento de prueba Z.
  9. Otras pruebas de ubicación que se pueden realizar como pruebas Z son la prueba de ubicación de dos muestras y la prueba de diferencias pareadas .

Condiciones [ editar ]

Para que la prueba Z sea ​​aplicable, se deben cumplir ciertas condiciones.

  • Los parámetros molestos deben conocerse o estimarse con alta precisión (un ejemplo de un parámetro molesto sería la desviación estándar en una prueba de ubicación de una muestra). Las pruebas Z se centran en un solo parámetro y tratan todos los demás parámetros desconocidos como si estuvieran fijos en sus valores verdaderos. En la práctica, debido al teorema de Slutsky , se puede justificar "incorporar" estimaciones consistentes de parámetros de molestia. Sin embargo, si el tamaño de la muestra no es lo suficientemente grande para que estas estimaciones sean razonablemente precisas, es posible que la prueba Z no funcione bien.
  • La estadística de prueba debe seguir una distribución normal . Generalmente, se apela al teorema del límite central para justificar el supuesto de que una estadística de prueba varía normalmente. Existe una gran cantidad de investigación estadística sobre la cuestión de cuándo una estadística de prueba varía aproximadamente normalmente. Si la variación del estadístico de la prueba es muy anormal, no se debe utilizar una prueba Z.

Si las estimaciones de los parámetros de molestia se incluyen como se discutió anteriormente, es importante usar estimaciones apropiadas para la forma en que se muestrearon los datos . En el caso especial de las pruebas Z para el problema de ubicación de una o dos muestras, la desviación estándar de la muestra habitual solo es apropiada si los datos se recopilaron como una muestra independiente.

En algunas situaciones, es posible diseñar una prueba que dé cuenta adecuadamente de la variación en las estimaciones de complementos de los parámetros molestos. En el caso de problemas de ubicación de una y dos muestras, una prueba t hace esto.

Ejemplo [ editar ]

Suponga que en una región geográfica particular, la media y la desviación estándar de los puntajes en una prueba de lectura son 100 puntos y 12 puntos, respectivamente. Nuestro interés está en los puntajes de 55 estudiantes en una escuela en particular que recibieron un puntaje promedio de 96. Podemos preguntar si este puntaje promedio es significativamente más bajo que el promedio regional, es decir, si los estudiantes de esta escuela son comparables a un simple aleatorio muestra de 55 estudiantes de la región en su conjunto, o sus puntajes son sorprendentemente bajos?

Primero calcule el error estándar de la media:

donde es la desviación estándar de la población.

A continuación, calcule la puntuación z , que es la distancia entre la media de la muestra y la media de la población en unidades del error estándar:

En este ejemplo, tratamos la media poblacional y la varianza como conocidas, lo que sería apropiado si todos los estudiantes de la región fueran evaluados. Cuando se desconocen los parámetros de la población, se debe realizar una prueba t de Student en su lugar.

La puntuación media del aula es 96, que es -2,47 unidades de error estándar de la media de la población de 100. Al buscar la puntuación z en una tabla de la probabilidad acumulada de la distribución normal estándar , encontramos que la probabilidad de observar un valor normal estándar a continuación −2,47 es aproximadamente 0,5 - 0,4932 = 0,0068. Este es el valor p unilateral para la hipótesis nula de que los 55 estudiantes son comparables a una muestra aleatoria simple de la población de todos los examinados. El valor p de dos lados es aproximadamente 0.014 (el doble del valor p de un lado ).

Otra forma de decir las cosas es que con probabilidad 1 - 0.014 = 0.986, una muestra aleatoria simple de 55 estudiantes tendría una puntuación media de prueba dentro de 4 unidades de la media de la población. También podríamos decir que con un 98,6% de confianza rechazamos la hipótesis nula de que los 55 examinados son comparables a una muestra aleatoria simple de la población de examinados.

La prueba Z nos dice que los 55 estudiantes de interés tienen una puntuación media inusualmente baja en comparación con la mayoría de las muestras aleatorias simples de tamaño similar de la población de examinados. Una deficiencia de este análisis es que no considera si el tamaño del efecto de 4 puntos es significativo. Si en lugar de un aula, consideramos una subregión que contiene 900 estudiantes cuya puntuación media es 99, se observaría casi la misma puntuación z y valor p . Esto muestra que si el tamaño de la muestra es lo suficientemente grande, diferencias muy pequeñas con respecto al valor nulo pueden ser muy significativas desde el punto de vista estadístico. Consulte las pruebas de hipótesis estadísticas para obtener más información sobre este tema.

Pruebas Z distintas de las pruebas de ubicación [ editar ]

Las pruebas de ubicación son las pruebas Z más conocidas . Otra clase de pruebas Z surge en la estimación de máxima verosimilitud de los parámetros en un modelo estadístico paramétrico . Las estimaciones de máxima verosimilitud son aproximadamente normales en determinadas condiciones, y su varianza asintótica se puede calcular en términos de la información de Fisher. La estimación de máxima verosimilitud dividida por su error estándar se puede utilizar como un estadístico de prueba para la hipótesis nula de que el valor poblacional del parámetro es igual a cero. De manera más general, si es la estimación de máxima verosimilitud de un parámetro θ, y θ 0 es el valor de θ bajo la hipótesis nula,

se puede utilizar como estadística de prueba Z.

Cuando se utiliza una prueba Z para estimaciones de máxima verosimilitud, es importante tener en cuenta que la aproximación normal puede ser deficiente si el tamaño de la muestra no es lo suficientemente grande. Aunque no existe una regla simple y universal que indique qué tan grande debe ser el tamaño de la muestra para usar una prueba Z , la simulación puede dar una buena idea de si una prueba Z es apropiada en una situación dada.

Las pruebas Z se emplean siempre que se pueda argumentar que un estadístico de prueba sigue una distribución normal bajo la hipótesis nula de interés. Muchas estadísticas de prueba no paramétricas , como las estadísticas U , son aproximadamente normales para tamaños de muestra suficientemente grandes y, por lo tanto, a menudo se realizan como pruebas Z.

Ver también [ editar ]

  • Distribución normal
  • Mesa normal estándar
  • Puntuación estándar
  • Prueba t de estudiante

Referencias [ editar ]

  • Sprinthall, RC (2011). Análisis estadístico básico (9ª ed.). Educación Pearson. ISBN 978-0-205-05217-2.
  • Casella, G. , Berger, RL (2002). Inferencia estadística . Prensa de Duxbury. ISBN 0-534-24312-6 . 
  • Douglas C. Montgomery, George C. Runger. (2014). Estadística aplicada y probabilidad para ingenieros (6ª ed.). John Wiley & Sons, inc. ISBN 9781118539712 , 9781118645062 .