t- estadístico

En estadística , la estadística t es la relación entre la desviación del valor estimado de un parámetro de su valor hipotético y su error estándar . Se utiliza en la prueba de hipótesis mediante la prueba t de Student . La estadística t se utiliza en una prueba t para determinar si respalda o rechaza la hipótesis nula. Es muy similar al puntaje Z, pero con la diferencia de que se usa el estadístico t cuando el tamaño de la muestra es pequeño o se desconoce la desviación estándar de la población. Por ejemplo, la estadística t se utiliza para estimar lamedia de la población a partir de una distribución de muestreo de medias de la muestra si la población desviación estándar es desconocida. También se usa junto con el valor p cuando se ejecutan pruebas de hipótesis donde el valor p nos dice cuáles son las probabilidades de que los resultados hayan sucedido.

Definición y características

Dejar ${\ Displaystyle \ scriptstyle {\ widehat {\ beta}}}$ ser un estimador del parámetro β en algún modelo estadístico . Entonces, una estadística t para este parámetro es cualquier cantidad de la forma

{\ displaystyle t _ {\ widehat {\ beta}} = {\ frac {{\ widehat {\ beta}} - \ beta _ {0}} {\ operatorname {se} ({\ widehat {\ beta}})} }}

donde β ₀ es una constante conocida no aleatoria que puede coincidir o no con el valor real del parámetro desconocido β , y ${\ Displaystyle \ operatorname {se} ({\ widehat {\ beta}})}$ es el error estándar del estimador ${\ Displaystyle \ scriptstyle {\ widehat {\ beta}}}$ para β .

De forma predeterminada, los paquetes estadísticos informan la estadística t con β ₀ = 0 (estas estadísticas t se utilizan para probar la significancia del regresor correspondiente). Sin embargo, cuando se necesita el estadístico t para probar la hipótesis de la forma H ₀ : β = β ₀ , entonces se puede usar un β ₀ distinto de cero .

Si ${\ Displaystyle \ scriptstyle {\ widehat {\ beta}}}$ es un estimador de mínimos cuadrados ordinario en el modelo de regresión lineal clásico (es decir, con términos de error homocedásticos y distribuidos normalmente ), y si el valor real del parámetro β es igual a β ₀ , entonces la distribución muestral del estadístico t es la de Student t distribución t con ( n - k ) grados de libertad, donde n es el número de observaciones, y k es el número de regresores (incluyendo el intercepto) ^[^{citación necesaria}^] .

En la mayoría de modelos, el estimador ${\ Displaystyle \ scriptstyle {\ widehat {\ beta}}}$ es consistente para β y se distribuye asintóticamente normalmente . Si el valor real del parámetro β es igual a β ₀ y la cantidad ${\ Displaystyle \ scriptstyle \ operatorname {se} ({\ widehat {\ beta}})}$ estima correctamente la varianza asintótica de este estimador, entonces el estadístico t tendrá asintóticamente la distribución normal estándar .

En algunos modelos, la distribución del estadístico t es diferente de la distribución normal, incluso asintóticamente. Por ejemplo, cuando una serie de tiempo con una raíz unitaria se retrocede en la prueba de Dickey-Fuller aumentada , la prueba t- estadística tendrá asintóticamente una de las distribuciones de Dickey-Fuller (dependiendo de la configuración de la prueba).

Usar

Con mayor frecuencia, los estadísticos t se utilizan en las pruebas t de Student , una forma de prueba de hipótesis estadísticas , y en el cálculo de ciertos intervalos de confianza .

La propiedad clave del estadístico t es que es una cantidad fundamental ; aunque se define en términos de la media muestral, su distribución muestral no depende de los parámetros de la población y, por lo tanto, se puede utilizar independientemente de cuáles sean.

También se puede dividir un residuo por la desviación estándar de la muestra :

{\ Displaystyle g (x, X) = {\ frac {x - {\ overline {X}}} {s}}}

para calcular una estimación del número de desviaciones estándar, una muestra dada es a partir de la media, como una versión de muestra de una puntuación z, la puntuación z que requiere los parámetros de población.

Predicción

Dada una distribución normal ${\ Displaystyle N (\ mu, \ sigma ^ {2})}$ con media y varianza desconocidas, la estadística t de una observación futura ${\ Displaystyle X_ {n + 1},}$ después de haber hecho n observaciones, es una estadística auxiliar - una cantidad fundamental (no depende de los valores de μ y σ ² ) que es una estadística (calculada a partir de observaciones). Esto permite calcular un intervalo de predicción frecuentista (un intervalo de confianza predictivo ), a través de la siguiente distribución t:

{\ Displaystyle {\ frac {X_ {n + 1} - {\ overline {X}} _ {n}} {s_ {n} {\ sqrt {1 + n ^ {- 1}}}}} \ sim T ^ {n-1}}

Resolviendo para ${\ Displaystyle X_ {n + 1}}$ produce la distribución de predicción

{\ Displaystyle {\ overline {X}} _ {n} + s_ {n} {\ sqrt {1 + n ^ {- 1}}} \ cdot T ^ {n-1}}

a partir del cual se pueden calcular intervalos de confianza predictivos - dada una probabilidad p, se pueden calcular intervalos tales que el 100 p % del tiempo, la siguiente observación ${\ Displaystyle X_ {n + 1}}$ caerá en ese intervalo.

Historia

El término " estadístico t " se abrevia de "estadístico de prueba de hipótesis". ^[1]^{[ cita requerida ]} En estadística, la distribución t se derivó por primera vez como una distribución posterior en 1876 por Helmert ^[2]^[3]^[4] y Lüroth . ^[5]^[6]^[7] La distribución t también apareció en una forma más general como distribución de Pearson Tipo IV en el artículo de 1895 de Karl Pearson . ^[8] Sin embargo, la Distribución T, también conocida como Distribución T de Student recibe su nombre de William Sealy Gosset, quien la publicó por primera vez en la literatura inglesa en su artículo de 1908 titulado Biometrika usando su seudónimo "Student" ^[9]^[10] porque su El empleador prefería que el personal utilizara seudónimos al publicar artículos científicos en lugar de su nombre real, por lo que utilizó el nombre "Estudiante" para ocultar su identidad. ^[11] Gosset trabajaba en la fábrica de cerveza Guinness en Dublín , Irlanda , y estaba interesado en los problemas de las muestras pequeñas, por ejemplo, las propiedades químicas de la cebada, donde los tamaños de muestra pueden ser tan pequeños como 3. De ahí una segunda versión de la etimología de El término Student es que Guinness no quería que sus competidores supieran que estaban usando la prueba t para determinar la calidad de la materia prima. Aunque fue William Gosset quien dio nombre al término "Estudiante", en realidad fue a través del trabajo de Ronald Fisher que la distribución se hizo conocida como "Distribución de estudiante" ^[12]^[13] y " Prueba t de Student ".

Conceptos relacionados

puntuación z (estandarización) : si se conocen los parámetros de la población, en lugar de calcular el estadístico t, se puede calcular la puntuación z; de manera análoga, en lugar de usar unaprueba t , se usa una prueba z . Esto es raro fuera de las pruebas estandarizadas .
Residuo estudentizado : En el análisis de regresión , los errores estándar de los estimadores en diferentes puntos de datos varían (compare los puntos intermedios con los extremos de una regresión lineal simple ), y por lo tanto, se deben dividir los diferentes residuales por diferentes estimaciones del error, produciendo lo que se llama Residuos estudentizados .

Ver también

F- prueba
t 2 -estadístico
Distribución T de Student
Prueba t de Student
Evaluación de la hipótesis
Distribuciones plegadas en t y media t
Distribución chi-cuadrado

Referencias

^ El microbioma en salud y enfermedad . Prensa académica. 29 de mayo de 2020. p. 397. ISBN 978-0-12-820001-8.
^ Szabó, István (2003), "Systeme aus einer endlichen Anzahl starrer Körper", Einführung in die Technische Mechanik , Springer Berlin Heidelberg, págs. 196-199, doi : 10.1007 / 978-3-642-61925-0_16 , ISBN 978-3-540-13293-6
^ Schlyvitch, B. (octubre de 1937). "Untersuchungen über den anastomotischen Kanal zwischen der Arteria coeliaca und mesenterica superior und damit in Zusammenhang stehende Fragen". Zeitschrift für Anatomie und Entwicklungsgeschichte . 107 (6): 709–737. doi : 10.1007 / bf02118337 . ISSN 0340-2061 . S2CID 27311567 .
^ Helmert (1876). "Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit" . Astronomische Nachrichten (en alemán). 88 (8–9): 113–131. Código bibliográfico : 1876AN ..... 88..113H . doi : 10.1002 / asna.18760880802 .
^ Lüroth, J. (1876). "Vergleichung von zwei Werthen des wahrscheinlichen Fehlers" . Astronomische Nachrichten (en alemán). 87 (14): 209–220. Código bibliográfico : 1876AN ..... 87..209L . doi : 10.1002 / asna.18760871402 .
^ Pfanzagl, J. (1996). "Estudios en la historia de la probabilidad y la estadística XLIV. Un precursor de la distribución t". Biometrika . 83 (4): 891–898. doi : 10.1093 / biomet / 83.4.891 . Señor 1766040 .
^ Sheynin, Oscar (1995). "El trabajo de Helmert en la teoría de los errores". Archivo de Historia de las Ciencias Exactas . 49 (1): 73–104. doi : 10.1007 / BF00374700 . ISSN 0003-9519 . S2CID 121241599 .
^ "X. Contribuciones a la teoría matemática de la evolución. — II. Variación sesgada en material homogéneo" . Philosophical Transactions de la Royal Society de Londres Una . 186 : 343–414. 1895. doi : 10.1098 / rsta.1895.0010 . ISSN 1364-503X .
^ "Estudiante" ( William Sealy Gosset ) (1908). "El probable error de una media". Biometrika . 6 (1): 1–25. doi : 10.1093 / biomet / 6.1.1 . hdl : 10338.dmlcz / 143545 . JSTOR 2331554 .
^ "Tabla T | Historia de la tabla T, etimología, tabla T de una cola, tabla T de dos colas y estadística T" .
^ Wendl, MC (2016). "Fama seudónima". Ciencia . 351 (6280): 1406. doi : 10.1126 / science.351.6280.1406 . PMID 27013722 .
^ Tuttle, Maryland; Anazonwu, Bs., Walter; Rubin, Maryland, Lee (2014). "Análisis de subgrupos de ácido tranexámico tópico en artroplastia total de rodilla" . Revisión reconstructiva . 4 (2): 37–41. doi : 10.15438 / rr.v4i2.72 .
^ Walpole, Ronald E. (2006). Probabilidad y estadística para ingenieros y científicos . Myers, H. Raymond. (7ª ed.). Nueva Delhi: Pearson. ISBN 81-7758-404-9. OCLC 818811849 .

enlaces externos

[1] El microbioma en salud y enfermedad . Prensa académica. 29 de mayo de 2020. p. 397. ISBN 978-0-12-820001-8.

[2] Szabó, István (2003), "Systeme aus einer endlichen Anzahl starrer Körper", Einführung in die Technische Mechanik , Springer Berlin Heidelberg, págs. 196-199, doi : 10.1007 / 978-3-642-61925-0_16 , ISBN 978-3-540-13293-6

[3] Schlyvitch, B. (octubre de 1937). "Untersuchungen über den anastomotischen Kanal zwischen der Arteria coeliaca und mesenterica superior und damit in Zusammenhang stehende Fragen". Zeitschrift für Anatomie und Entwicklungsgeschichte . 107 (6): 709–737. doi : 10.1007 / bf02118337 . ISSN 0340-2061 . S2CID 27311567 .

[4] Helmert (1876). "Die Genauigkeit der Formel von Peters zur Berechnung des wahrscheinlichen Beobachtungsfehlers directer Beobachtungen gleicher Genauigkeit" . Astronomische Nachrichten (en alemán). 88 (8–9): 113–131. Código bibliográfico : 1876AN ..... 88..113H . doi : 10.1002 / asna.18760880802 .

[5] Lüroth, J. (1876). "Vergleichung von zwei Werthen des wahrscheinlichen Fehlers" . Astronomische Nachrichten (en alemán). 87 (14): 209–220. Código bibliográfico : 1876AN ..... 87..209L . doi : 10.1002 / asna.18760871402 .

[6] Pfanzagl, J. (1996). "Estudios en la historia de la probabilidad y la estadística XLIV. Un precursor de la distribución t". Biometrika . 83 (4): 891–898. doi : 10.1093 / biomet / 83.4.891 . Señor 1766040 .

[7] Sheynin, Oscar (1995). "El trabajo de Helmert en la teoría de los errores". Archivo de Historia de las Ciencias Exactas . 49 (1): 73–104. doi : 10.1007 / BF00374700 . ISSN 0003-9519 . S2CID 121241599 .

[8] "X. Contribuciones a la teoría matemática de la evolución. — II. Variación sesgada en material homogéneo" . Philosophical Transactions de la Royal Society de Londres Una . 186 : 343–414. 1895. doi : 10.1098 / rsta.1895.0010 . ISSN 1364-503X .

[9] "Estudiante" ( William Sealy Gosset ) (1908). "El probable error de una media". Biometrika . 6 (1): 1–25. doi : 10.1093 / biomet / 6.1.1 . hdl : 10338.dmlcz / 143545 . JSTOR 2331554 .

[10] "Tabla T | Historia de la tabla T, etimología, tabla T de una cola, tabla T de dos colas y estadística T" .

[11] Wendl, MC (2016). "Fama seudónima". Ciencia . 351 (6280): 1406. doi : 10.1126 / science.351.6280.1406 . PMID 27013722 .

[12] Tuttle, Maryland; Anazonwu, Bs., Walter; Rubin, Maryland, Lee (2014). "Análisis de subgrupos de ácido tranexámico tópico en artroplastia total de rodilla" . Revisión reconstructiva . 4 (2): 37–41. doi : 10.15438 / rr.v4i2.72 .

[13] Walpole, Ronald E. (2006). Probabilidad y estadística para ingenieros y científicos . Myers, H. Raymond. (7ª ed.). Nueva Delhi: Pearson. ISBN 81-7758-404-9. OCLC 818811849 .

[1]