Prueba t de Welch

En estadística , la prueba t de Welch , o prueba t de varianzas desiguales , es una prueba de ubicación de dos muestras que se utiliza para probar la hipótesis de que dos poblaciones tienen medias iguales. Lleva el nombre de su creador, Bernard Lewis Welch , y es una adaptación de la prueba t de Student , ^[1] y es más confiable cuando las dos muestras tienen varianzas desiguales y / o tamaños de muestra desiguales. ^[2]^[3] Estas pruebas a menudo se denominan "muestras independientes" o "no emparejadas" t-pruebas, ya que normalmente se aplican cuando las unidades estadísticas subyacentes a las dos muestras que se comparan no se superponen. Dado que la prueba t de Welch ha sido menos popular que la prueba t de Student ^[2] y puede ser menos familiar para los lectores, un nombre más informativo es " prueba t de varianzas desiguales de Welch " o " prueba t de varianzas desiguales " para abreviar . ^[3]

Supuestos

La prueba t de Student supone que las medias muestrales (estadísticas de prueba) de dos distribuciones de población que se comparan se distribuyen normalmente con la misma varianza. La prueba t de Welch está diseñada para la varianza de distribución de la muestra desigual, pero se mantiene el supuesto de una muestra distribuida normalmente. ^[1] La prueba t de Welch es una solución aproximada al problema de Behrens-Fisher .

Cálculos

La prueba t de Welch define el estadístico t mediante la siguiente fórmula:

{\ Displaystyle t = {\ frac {\ Delta {\ overline {X}}} {s _ {\ Delta {\ bar {X}}}}} = {\ frac {{\ overline {X}} _ {1} - {\ overline {X}} _ {2}} {\ sqrt {{s _ {{\ bar {X}} _ {1}} ^ {2}} + {s _ {{\ bar {X}} _ { 2}} ^ {2}}}}} \,}

{\ Displaystyle s _ {{\ bar {X}} _ {i}} = {s_ {i} \ over {\ sqrt {N_ {i}}}} \,}

dónde ${\ Displaystyle {\ overline {X}} _ {i}}$ y ${\ Displaystyle s _ {{\ bar {X}} _ {i}}}$ son los ${\ Displaystyle i ^ {th}}$ media muestral y su error estándar , para una desviación estándar y un tamaño de muestra dados . A diferencia de la prueba t de Student , el denominador no se basa en una estimación de la varianza combinada .

Los grados de libertad ${\ Displaystyle \ nu}$ asociado con esta estimación de la varianza se aproxima mediante la ecuación de Welch-Satterthwaite :

{\ Displaystyle \ nu ^ {- 1} \ approx {\ frac {\ nu _ {1} ^ {- 1} s _ {{\ bar {X}} _ {1}} ^ {4} + \ nu _ { 2} ^ {- 1} s _ {{\ bar {X}} _ {2}} ^ {4}} {s _ {\ Delta {\ bar {X}}} ^ {4}}}}

Aquí, ${\ Displaystyle \ nu _ {i} = N_ {i} -1}$ son los grados de libertad asociados con la i-ésima estimación de la varianza.

La estadística es aproximadamente de la distribución t, ya que tenemos una aproximación de la distribución chi-cuadrado . Esta aproximación se hace mejor cuando ambos ${\ Displaystyle N_ {1}}$ y ${\ Displaystyle N_ {2}}$ son mayores que 5. ^[4]^[5]

Prueba estadística

Una vez t y ${\ Displaystyle \ nu}$ se han calculado, estas estadísticas se pueden utilizar con la distribución t para probar una de las dos posibles hipótesis nulas :

que las dos medias poblacionales son iguales, en lo que se aplica una prueba de dos colas ; o
que una de las medias poblacionales es mayor o igual que la otra, en la que se aplica una prueba de una cola .

Los grados de libertad aproximados se redondean al número entero más cercano. ^{[ cita requerida ]}

Ventajas y limitaciones

La prueba t de Welch es más robusta que la prueba t de Student y mantiene tasas de error de tipo I cercanas a las nominales para varianzas desiguales y tamaños de muestra desiguales en condiciones normales. Además, la potencia de la prueba t de Welch se acerca a la de la prueba t de Student, incluso cuando las varianzas de la población son iguales y los tamaños de la muestra están equilibrados. ^[2] La prueba t de Welch se puede generalizar a más de 2 muestras, ^[6] que es más robusto que el análisis de varianza unidireccional (ANOVA).

No se recomienda realizar una prueba previa para varianzas iguales y luego elegir entre la prueba t de Student o la prueba t de Welch . ^[7] Más bien, la prueba t de Welch se puede aplicar directamente y sin desventajas sustanciales a la prueba t de Student, como se indicó anteriormente. La prueba t de Welch sigue siendo sólida para distribuciones sesgadas y tamaños de muestra grandes. ^{[8] La} confiabilidad disminuye para distribuciones sesgadas y muestras más pequeñas, donde posiblemente se podría realizar la prueba t de Welch . ^[9]

Ejemplos de

Los siguientes tres ejemplos comparan la prueba t de Welch y la prueba t de Student. Las muestras son de distribuciones normales al azar utilizando el lenguaje de programación R .

Para los tres ejemplos, las medias poblacionales fueron ${\ Displaystyle \ mu _ {1} = 20}$ y ${\ Displaystyle \ mu _ {2} = 22}$ .

El primer ejemplo es para varianzas iguales ( ${\ Displaystyle \ sigma _ {1} ^ {2} = \ sigma _ {2} ^ {2} = 4}$ ) y tamaños de muestra iguales ( ${\ Displaystyle N_ {1} = N_ {2} = 15}$ ). Deje que A1 y A2 denoten dos muestras aleatorias:

{\ displaystyle A_ {1} = \ {27.5,21.0,19.0,23.6,17.0,17.9,16.9,20.1,21.9,22.6,23.1,19.6,19.0,21.7,21.4 \}}

{\ displaystyle A_ {2} = \ {27.1,22.0,20.8,23.4,23.4,23.5,25.8,22.0,24.8,20.2,21.9,22.1,22.9,20.5,24.4 \}}

El segundo ejemplo es para variaciones desiguales ( ${\ Displaystyle \ sigma _ {1} ^ {2} = 16}$ , ${\ Displaystyle \ sigma _ {2} ^ {2} = 1}$ ) y tamaños de muestra desiguales ( ${\ Displaystyle N_ {1} = 10}$ , ${\ Displaystyle N_ {2} = 20}$ ). La muestra más pequeña tiene la varianza más grande:

{\ displaystyle {\ begin {alineado} A_ {1} & = \ {17.2,20.9,22.6,18.1,21.7,21.4,23.5,24.2,14.7,21.8 \} \\ A_ {2} & = \ {21.5, 22.8, 21.0, 23.0, 21.6, 23.6, 22.5, 20.7, 23.4, 21.8, 20.7, 21.7, 21.5, 22.5, 23.6, 21.5, 22.5, 23.5, 21.5, 21.8 \} \ end {alineado}}}

El tercer ejemplo es para variaciones desiguales ( ${\ Displaystyle \ sigma _ {1} ^ {2} = 1}$ , ${\ Displaystyle \ sigma _ {2} ^ {2} = 16}$ ) y tamaños de muestra desiguales ( ${\ Displaystyle N_ {1} = 10}$ , ${\ Displaystyle N_ {2} = 20}$ ). La muestra más grande tiene la varianza más grande:

{\ displaystyle {\ begin {alineado} A_ {1} & = \ {19.8,20.4,19.6,17.8,18.5,18.9,18.3,18.9,19.5,22.0 \} \\ A_ {2} & = \ {28.2, 26.6,20.1,23.3,25.2,22.1,17.7,27.6,20.6,13.7,23.2,17.5,20.6,18.0,23.9,21.6,24.3,20.4,24.0,13.2 \} \ end {alineado}}}

Los valores p de referencia se obtuvieron simulando las distribuciones de los estadísticos t para la hipótesis nula de medias poblacionales iguales ( ${\ Displaystyle \ mu _ {1} - \ mu _ {2} = 0}$ ). Los resultados se resumen en la tabla siguiente, con valores p de dos colas:

	Muestra A1			Muestra A2			Prueba t de estudiante				Prueba t de Welch
Ejemplo	${\ Displaystyle N_ {1}}$	${\ Displaystyle {\ overline {X}} _ {1}}$	${\ Displaystyle s_ {1} ^ {2}}$	${\ Displaystyle N_ {2}}$	${\ Displaystyle {\ overline {X}} _ {2}}$	${\ Displaystyle s_ {2} ^ {2}}$	${\ Displaystyle t}$	${\ Displaystyle \ nu}$	${\ Displaystyle P}$	${\ Displaystyle P _ {\ mathrm {sim}}}$	${\ Displaystyle t}$	${\ Displaystyle \ nu}$	${\ Displaystyle P}$	${\ Displaystyle P _ {\ mathrm {sim}}}$
1	15	20,8	7,9	15	23,0	3.8	−2,46	28	0.021	0.021	−2,46	24,9	0.021	0,017
2	10	20,6	9.0	20	22,1	0,9	−2,10	28	0,045	0,150	−1,57	9,9	0,149	0,144
3	10	19,4	1.4	20	21,6	17.1	−1,64	28	0,110	0,036	−2,22	24,5	0,036	0,042

La prueba t de Welch y la prueba t de Student dieron resultados idénticos cuando las dos muestras tienen varianzas y tamaños de muestra idénticos (Ejemplo 1). Pero tenga en cuenta que si muestra datos de poblaciones con varianzas idénticas, las varianzas muestrales serán diferentes, al igual que los resultados de las dos pruebas t. Entonces, con datos reales, las dos pruebas casi siempre darán resultados algo diferentes.

Para varianzas desiguales, la prueba t de Student dio un valor p bajo cuando la muestra más pequeña tenía una varianza mayor (Ejemplo 2) y un valor p alto cuando la muestra más grande tenía una varianza mayor (Ejemplo 3). Para varianzas desiguales, la prueba t de Welch dio valores p cercanos a los valores p simulados.

Implementaciones de software

Idioma / Programa	Función	Documentación
LibreOffice	`TTEST(Data1; Data2; Mode; Type)`	^[10]
MATLAB	`ttest2(data1, data2, 'Vartype', 'unequal')`	^[11]
Microsoft Excel anterior a 2010	`TTEST(array1, array2, tails, type)`	^[12]
Microsoft Excel 2010 y posterior	`T.TEST(array1, array2, tails, type)`	^[13]
Minitab	Accedido a través del menú	^[14]
SAS (software)	Salida predeterminada de `proc ttest`(etiquetada "Satterthwaite")
Pitón	`scipy.stats.ttest_ind(a, b, equal_var=False)`	^[15]
R	`t.test(data1, data2, alternative="two.sided", var.equal=FALSE)`	^[dieciséis]
Haskell	`Statistics.Test.StudentT.welchTTest SamplesDiffer data1 data2`	^[17]
JMP	`Oneway( Y( YColumn), X( XColumn), Unequal Variances( 1 ) );`	^[18]
Julia	`UnequalVarianceTTest(data1, data2)`	^[19]
Stata	`ttest varname1 == varname2, welch`	^[20]
Hojas de cálculo de Google	`TTEST(range1, range2, tails, type)`	^[21]
Prisma GraphPad	Es una opción en el cuadro de diálogo de la prueba t.
Estadísticas de IBM SPSS	Una opción en el menú	^[22]^[23]
GNU Octave	`welch_test(x, y)`	^[24]

Ver también

Prueba t de estudiante
Prueba Z
Experimento factorial
Análisis de varianza de una sola vía
Estadístico T cuadrado de dos muestras de Hotelling , una extensión multivariante de la prueba t de Welch

Referencias

↑ a b Welch, BL (1947). "La generalización del problema de" Student "cuando se involucran varias variaciones de población diferentes". Biometrika . 34 (1–2): 28–35. doi : 10.1093 / biomet / 34.1-2.28 . Señor 0019277 . PMID 20287819 .
^ a b c Ruxton, GD (2006). "La prueba t de varianza desigual es una alternativa infrautilizada a la prueba t de Student y la prueba U de Mann-Whitney" . Ecología del comportamiento . 17 (4): 688–690. doi : 10.1093 / beheco / ark016 .
^ a b Derrick, B; Al rebaño; Blanco, P (2016). "Por qué la prueba de Welchs es robusta ante errores de tipo I" (PDF) . Los métodos cuantitativos para la psicología . 12 (1): 30–38. doi : 10.20982 / tqmp.12.1.p030 .
^ La fórmula de Satterthwaite para los grados de libertad en la prueba t de dos muestras (página 7)
^ Yates, Moore y Starnes, La práctica de la estadística, 3ª ed., P. 792. Copyright 2008 de WH Freeman and Company, 41 Madison Avenue, Nueva York, NY 10010
^ Welch, BL (1951). "Sobre la comparación de varios valores medios: un enfoque alternativo". Biometrika . 38 (3/4): 330–336. doi : 10.2307 / 2332579 . JSTOR 2332579 .
^ Zimmerman, DW (2004). "Una nota sobre las pruebas preliminares de igualdad de varianzas". Revista británica de psicología matemática y estadística . 57 : 173-181. doi : 10.1348 / 000711004849222 .
^ Fagerland, MW (2012). "Pruebas t, pruebas no paramétricas y grandes estudios: ¿una paradoja de la práctica estadística?" . Metodología de Investigación Médica de BMC . 12 : 78. doi : 10.1186 / 1471-2288-12-78 . PMC 3445820 . PMID 22697476 .
^ Fagerland, MW; Sandvik, L. (2009). "Realización de cinco pruebas de ubicación de dos muestras para distribuciones sesgadas con variaciones desiguales". Ensayos clínicos contemporáneos . 30 (5): 490–496. doi : 10.1016 / j.cct.2009.06.007 .
^ https://help.libreoffice.org/Calc/Statistical_Functions_Part_Five#TTEST
^ http://uk.mathworks.com/help/stats/ttest2.html
^ http://office.microsoft.com/en-us/excel-help/ttest-HP005209325.aspx
^ http://office.microsoft.com/en-us/excel-help/t-test-function-HA102753135.aspx
^ Descripción general de t de 2 muestras - Minitab: - documentación oficial para la versión 18 de Minitab. Consultado el 19 de septiembre de 2020.
^ http://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html
^ https://stat.ethz.ch/R-manual/R-devel/library/stats/html/t.test.html
^ http://hackage.haskell.org/package/statistics-0.15.0.0/docs/Statistics-Test-StudentT.html
^ https://www.jmp.com/support/help/
^ http://hypothesistestsjl.readthedocs.org/en/latest/index.html
^ http://www.stata.com/help.cgi?ttest
^ https://support.google.com/docs/answer/6055837?hl=es
^ Jeremy Miles: ¿ Prueba t de varianzas desiguales o prueba U de Mann-Whitney? , Consultado 2014-04-11
^ Prueba de una muestra : documentación oficial de SPSS Statistics versión 24. Consultado el 22 de enero de 2019.
^ https://octave.sourceforge.io/statistics/function/welch_test.html

[Welch1947-1] Welch, BL (1947). "La generalización del problema de" Student "cuando se involucran varias variaciones de población diferentes". Biometrika . 34 (1–2): 28–35. doi : 10.1093 / biomet / 34.1-2.28 . Señor 0019277 . PMID 20287819 .

[Ruxton2006-2] Ruxton, GD (2006). "La prueba t de varianza desigual es una alternativa infrautilizada a la prueba t de Student y la prueba U de Mann-Whitney" . Ecología del comportamiento . 17 (4): 688–690. doi : 10.1093 / beheco / ark016 .

[WhyWelch-3] Derrick, B; Al rebaño; Blanco, P (2016). "Por qué la prueba de Welchs es robusta ante errores de tipo I" (PDF) . Los métodos cuantitativos para la psicología . 12 (1): 30–38. doi : 10.20982 / tqmp.12.1.p030 .

[4] La fórmula de Satterthwaite para los grados de libertad en la prueba t de dos muestras (página 7)

[5] Yates, Moore y Starnes, La práctica de la estadística, 3ª ed., P. 792. Copyright 2008 de WH Freeman and Company, 41 Madison Avenue, Nueva York, NY 10010

[Welch1951-6] Welch, BL (1951). "Sobre la comparación de varios valores medios: un enfoque alternativo". Biometrika . 38 (3/4): 330–336. doi : 10.2307 / 2332579 . JSTOR 2332579 .

[Zimmerman2004-7] Zimmerman, DW (2004). "Una nota sobre las pruebas preliminares de igualdad de varianzas". Revista británica de psicología matemática y estadística . 57 : 173-181. doi : 10.1348 / 000711004849222 .

[Fagerland2012-8] Fagerland, MW (2012). "Pruebas t, pruebas no paramétricas y grandes estudios: ¿una paradoja de la práctica estadística?" . Metodología de Investigación Médica de BMC . 12 : 78. doi : 10.1186 / 1471-2288-12-78 . PMC 3445820 . PMID 22697476 .

[Fagerland2009-9] Fagerland, MW; Sandvik, L. (2009). "Realización de cinco pruebas de ubicación de dos muestras para distribuciones sesgadas con variaciones desiguales". Ensayos clínicos contemporáneos . 30 (5): 490–496. doi : 10.1016 / j.cct.2009.06.007 .

[10] ttps://help.libreoffice.org/Calc/Statistical_Functions_Part_Five#TTEST

[11] ttp://uk.mathworks.com/help/stats/ttest2.html

[12] ttp://office.microsoft.com/en-us/excel-help/ttest-HP005209325.aspx

[13] ttp://office.microsoft.com/en-us/excel-help/t-test-function-HA102753135.aspx

[14] Descripción general de t de 2 muestras - Minitab: - documentación oficial para la versión 18 de Minitab. Consultado el 19 de septiembre de 2020.

[15] ttp://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html

[16] ttps://stat.ethz.ch/R-manual/R-devel/library/stats/html/t.test.html

[17] ttp://hackage.haskell.org/package/statistics-0.15.0.0/docs/Statistics-Test-StudentT.html

[18] ttps://www.jmp.com/support/help/

[19] ttp://hypothesistestsjl.readthedocs.org/en/latest/index.html

[20] ttp://www.stata.com/help.cgi?ttest

[21] ttps://support.google.com/docs/answer/6055837?hl=es

[22] Jeremy Miles: ¿ Prueba t de varianzas desiguales o prueba U de Mann-Whitney? , Consultado 2014-04-11

[23] Prueba de una muestra : documentación oficial de SPSS Statistics versión 24. Consultado el 22 de enero de 2019.

[24] ttps://octave.sourceforge.io/statistics/function/welch_test.html

[1]