En estadística , una cantidad fundamental o pivote es una función de observaciones y parámetros no observables, de modo que la distribución de probabilidad de la función no depende de los parámetros desconocidos (incluidos los parámetros de molestia ). [1] No es necesario que una cantidad pivote sea una estadística ; la función y su valor pueden depender de los parámetros del modelo, pero su distribución no debe hacerlo. Si es una estadística, entonces se conoce como estadística auxiliar .
Más formalmente, [2] deja ser una muestra aleatoria de una distribución que depende de un parámetro (o vector de parámetros) . Dejar ser una variable aleatoria cuya distribución sea la misma para todos . Luegose llama una cantidad fundamental (o simplemente un pivote ).
Las cantidades fundamentales se utilizan comúnmente para la normalización para permitir la comparación de datos de diferentes conjuntos de datos. Es relativamente fácil construir pivotes para la ubicación y los parámetros de escala: para los primeros formamos diferencias para que la ubicación se cancele, para los segundos proporciones para que la escala se cancele.
Las cantidades fundamentales son fundamentales para la construcción de estadísticos de prueba , ya que permiten que el estadístico no dependa de parámetros; por ejemplo, el estadístico t de Student es para una distribución normal con varianza desconocida (y media). También proporcionan un método para construir intervalos de confianza , y el uso de cantidades fundamentales mejora el rendimiento del bootstrap . En forma de estadísticas auxiliares, se pueden utilizar para construir intervalos de predicción frecuentista (intervalos de confianza predictivos).
Ejemplos de
Distribución normal
Una de las cantidades fundamentales más simples es la puntuación z ; dada una distribución normal con media y varianza y una observación x, la puntuación z:
tiene distribución - una distribución normal con media 0 y varianza 1. De manera similar, dado que la media muestral de n muestras tiene una distribución muestral la puntuación z de la media
tambien tiene distribucion Tenga en cuenta que si bien estas funciones dependen de los parámetros, y por lo tanto, solo se pueden calcular si se conocen los parámetros (no son estadísticas), la distribución es independiente de los parámetros.
Dado observaciones independientes distribuidas de forma idéntica (iid) de la distribución normal con media desconocida y varianza , se puede obtener una cantidad fundamental de la función:
dónde
y
son estimaciones no sesgadas de y , respectivamente. La funciónes el estadístico t de Student para un nuevo valor, extraído de la misma población que el conjunto de valores ya observado .
Utilizando la función se convierte en una cantidad fundamental, que también se distribuye mediante la distribución t de Student congrados de libertad. Según sea necesario, aunque aparece como un argumento de la función , la distribución de no depende de los parámetros o de la distribución de probabilidad normal que gobierna las observaciones .
Esto se puede utilizar para calcular un intervalo de predicción para la siguiente observación.ver Intervalo de predicción: distribución normal .
Distribución normal bivariada
En casos más complicados, es imposible construir pivotes exactos. Sin embargo, tener pivotes aproximados mejora la convergencia a la normalidad asintótica .
Suponga una muestra de tamaño de vectores se toma de una distribución normal bivariada con correlación desconocida .
Un estimador de es la correlación muestral (Pearson, momento)
dónde son variaciones de muestra de y . La estadística de muestra tiene una distribución asintóticamente normal:
- .
Sin embargo, una transformación estabilizadora de la varianza
conocida como transformación z de Fisher del coeficiente de correlación permite crear la distribución de asintóticamente independiente de parámetros desconocidos:
dónde es el parámetro de distribución correspondiente. Para tamaños de muestra finitos, la variable aleatoria tendrá una distribución más cercana a la normal que la de . Se obtiene una aproximación aún más cercana a la distribución normal estándar utilizando una mejor aproximación para la varianza exacta: la forma habitual es
Robustez
Desde el punto de vista de las estadísticas robustas , las cantidades fundamentales son resistentes a los cambios en los parámetros, de hecho, independientes de los parámetros, pero no en general a los cambios en el modelo, como las violaciones del supuesto de normalidad. Esto es fundamental para la crítica sólida de las estadísticas no sólidas, a menudo derivadas de cantidades fundamentales: tales estadísticas pueden ser sólidas dentro de la familia, pero no lo son fuera de ella.
Ver también
Referencias
- ^ Shao, J. (2008). "Cantidades fundamentales" . Estadística matemática (2ª ed.). Nueva York: Springer. págs. 471–477. ISBN 978-0-387-21718-5.
- ^ DeGroot, Morris H .; Schervish, Mark J. (2011). Probabilidad y estadística (4ª ed.). Pearson. pag. 489. ISBN 978-0-321-70970-7.