Problema de Behrens-Fisher

Problema no resuelto en estadística :

¿Es necesaria una aproximación análoga al argumento de Fisher para resolver el problema de Behrens-Fisher?

(más problemas no resueltos en estadística)

En estadística , el problema de Behrens-Fisher , llamado así por Walter Behrens y Ronald Fisher , es el problema de la estimación de intervalo y la prueba de hipótesis sobre la diferencia entre las medias de dos poblaciones distribuidas normalmente cuando las varianzas de las dos poblaciones no se suponen iguales , basado en dos muestras independientes .

Especificación

Una dificultad para discutir el problema de Behrens-Fisher y las soluciones propuestas es que hay muchas interpretaciones diferentes de lo que se entiende por "el problema de Behrens-Fisher". Estas diferencias involucran no solo lo que se considera una solución relevante, sino incluso el enunciado básico del contexto que se está considerando.

Contexto

Deje que X ₁ , ..., X _n y Y ₁ , ..., Y _m sean iid muestras de dos poblaciones que ambos proceden de la misma familia de ubicación escala de distribuciones. Se supone que los parámetros de escala son desconocidos y no necesariamente iguales, y el problema es evaluar si los parámetros de ubicación pueden ser tratados como iguales de manera razonable. Lehmann ^[1] afirma que "el problema de Behrens-Fisher" se usa tanto para esta forma general de modelo cuando la familia de distribuciones es arbitraria como para cuando se hace la restricción a una distribución normal . Si bien Lehmann analiza una serie de enfoques para el problema más general, principalmente basados en no paramétricos, ^{[2] la} mayoría de las otras fuentes parecen usar "el problema de Behrens-Fisher" para referirse solo al caso en el que se supone que la distribución es normal: de este artículo hace esta suposición.

Requisitos de soluciones

Se han presentado soluciones al problema de Behrens-Fisher que hacen uso de un punto de vista de inferencia clásico o bayesiano y cualquier solución sería teóricamente inválida juzgada desde el otro punto de vista. Si la consideración se limita únicamente a la inferencia estadística clásica, es posible buscar soluciones al problema de inferencia que sean sencillas de aplicar en un sentido práctico, dando preferencia a esta simplicidad sobre cualquier inexactitud en los enunciados de probabilidad correspondientes. Cuando se requiera la exactitud de los niveles de significancia de las pruebas estadísticas, puede haber un requisito adicional de que el procedimiento debe hacer un uso máximo de la información estadística en el conjunto de datos. Es bien sabido que se puede obtener una prueba exacta descartando aleatoriamente los datos del conjunto de datos más grande hasta que los tamaños de muestra sean iguales, reuniendo los datos en pares y tomando las diferencias, y luego usando una prueba t ordinaria para probar si la diferencia de medias es cero: claramente esto no sería "óptimo" en ningún sentido.

La tarea de especificar estimaciones de intervalo para este problema es una en la que un enfoque frecuentista no proporciona una solución exacta, aunque se dispone de algunas aproximaciones. Los enfoques bayesianos estándar tampoco brindan una respuesta que pueda expresarse como fórmulas simples y directas, pero los métodos computacionales modernos de análisis bayesiano permiten encontrar soluciones esencialmente exactas. ^{[ cita requerida ]} Por lo tanto, el estudio del problema se puede utilizar para dilucidar las diferencias entre los enfoques frecuentista y bayesiano para la estimación de intervalo.

Esquema de diferentes enfoques

Enfoque de Behrens y Fisher

Ronald Fisher en 1935 introdujo la inferencia fiducial ^[3]^[4] para aplicarla a este problema. Se refirió a un artículo anterior de Walter Ulrich Behrens de 1929. Behrens y Fisher propusieron encontrar la distribución de probabilidad de

{\ Displaystyle T \ equiv {{\ bar {x}} _ {1} - {\ bar {x}} _ {2} \ over {\ sqrt {s_ {1} ^ {2} / n_ {1} + s_ {2} ^ {2} / n_ {2}}}}}

dónde ${\ displaystyle {\ bar {x}} _ {1}}$ y ${\ displaystyle {\ bar {x}} _ {2}}$ son las dos medias muestrales , y s ₁ y s ₂ son sus desviaciones estándar . Ver distribución de Behrens-Fisher . Fisher aproximó la distribución de esto ignorando la variación aleatoria de los tamaños relativos de las desviaciones estándar,

{\ Displaystyle {s_ {1} / {\ sqrt {n_ {1}}} \ over {\ sqrt {s_ {1} ^ {2} / n_ {1} + s_ {2} ^ {2} / n_ { 2}}}}.}

La solución de Fisher provocó controversia porque no tenía la propiedad de que la hipótesis de medias iguales sería rechazada con probabilidad α si las medias fueran de hecho iguales. Desde entonces se han propuesto muchos otros métodos para tratar el problema y se ha investigado el efecto sobre los intervalos de confianza resultantes. ^[5]

Solución t aproximada de Welch

Un método ampliamente utilizado es el de BL Welch , ^[6] quien, como Fisher, estuvo en el University College London . La varianza de la diferencia de medias

{\ displaystyle {\ bar {d}} = {\ bar {x}} _ {1} - {\ bar {x}} _ {2}}

resultados en

{\ Displaystyle s _ {\ bar {d}} ^ {2} = {\ frac {s_ {1} ^ {2}} {n_ {1}}} + {\ frac {s_ {2} ^ {2}} {n_ {2}}}.}

Welch (1938) aproximó la distribución de ${\ Displaystyle s _ {\ bar {d}} ^ {2}}$ por la distribución de Pearson de Tipo III (una distribución chi-cuadrado escalada ) cuyos dos primeros momentos concuerdan con el de ${\ Displaystyle s _ {\ bar {d}} ^ {2}}$ . Esto se aplica al siguiente número de grados de libertad (gl), que generalmente no es un número entero:

{\ Displaystyle \ nu \ approx {(\ gamma _ {1} + \ gamma _ {2}) ^ {2} \ over \ gamma _ {1} ^ {2} / (n_ {1} -1) + \ gamma _ {2} ^ {2} / (n_ {2} -1)} \ quad {\ text {donde}} \ gamma _ {i} = \ sigma _ {i} ^ {2} / n_ {i} .}

Bajo la hipótesis nula de expectativas iguales, μ ₁ = μ ₂ , la distribución del estadístico T de Behrens-Fisher , que también depende de la razón de varianza σ ₁² / σ ₂² , ahora podría aproximarse mediante la distribución t de Student con estas ν grados de libertad. Pero este ν contiene las varianzas poblacionales σ _i² , y estas son desconocidas. La siguiente estimación solo reemplaza las variaciones de la población por las variaciones de la muestra:

{\ Displaystyle {\ hat {\ nu}} \ approx {\ frac {(g_ {1} + g_ {2}) ^ {2}} {g_ {1} ^ {2} / (n_ {1} -1 ) + g_ {2} ^ {2} / (n_ {2} -1)}} \ quad {\ text {donde}} g_ {i} = s_ {i} ^ {2} / n_ {i}.}

Esto ${\ Displaystyle {\ hat {\ nu}}}$ es una variable aleatoria. No existe una distribución t con un número aleatorio de grados de libertad. No obstante, la T de Behrens-Fisher se puede comparar con un cuantil correspondiente de la distribución t de Student con estos números estimados de grados de libertad, ${\ Displaystyle {\ hat {\ nu}}}$ , que generalmente no es un número entero. De esta manera, el límite entre la región de aceptación y rechazo del estadístico de prueba T se calcula en base a las varianzas empíricas s _i² , de una manera que es una función suave de estas.

Este método tampoco da exactamente la tasa nominal, pero generalmente no está demasiado lejos. ^{[ cita requerida ]} Sin embargo, si las varianzas de la población son iguales, o si las muestras son bastante pequeñas y se puede suponer que las varianzas de la población son aproximadamente iguales, es más preciso utilizar la prueba t de Student . ^{[ cita requerida ]}

Otros enfoques

Se han propuesto varios enfoques diferentes del problema general, algunos de los cuales pretenden "resolver" alguna versión del problema. Entre estos se encuentran, ^[7]

el de Chapman en 1950, ^[8]
el de Prokof'yev y Shishkin en 1974, ^[9]
el de Dudewicz y Ahmed en 1998. ^[10]

En la comparación de Dudewicz de métodos seleccionados, ^[7] se encontró que el procedimiento Dudewicz-Ahmed se recomienda para uso práctico.

Soluciones exactas a los problemas comunes y generalizados de Behrens-Fisher

Durante varias décadas, se cree comúnmente que no se ha encontrado una solución exacta al problema común de Behrens-Fisher. ^{[ cita requerida ]} Sin embargo, se demostró en 1966 que tiene una solución exacta. ^[11] En 2018, se demostró la función de densidad de probabilidad de una distribución de Behrens-Fisher generalizada de m medias y m errores estándar distintos de m muestras de tamaños distintos de distribuciones normales independientes con medias y varianzas distintas y el artículo también examinó sus aproximaciones asintóticas. ^[12] Un artículo de seguimiento mostró que la prueba t pareada clásica es un problema central de Behrens-Fisher con un coeficiente de correlación poblacional distinto de cero y derivó su función de densidad de probabilidad correspondiente resolviendo su problema asociado no central de Behrens-Fisher con un coeficiente de correlación poblacional distinto de cero. ^[13] También resolvió un problema de Behrens-Fisher no central más general con un coeficiente de correlación de población distinto de cero en el apéndice. ^[13]

Variantes

Se ha estudiado una variante menor del problema de Behrens-Fisher. ^[14] En este caso, el problema es, suponiendo que las dos medias poblacionales son de hecho iguales, hacer inferencias sobre la media común: por ejemplo, se podría requerir un intervalo de confianza para la media común.

Generalizaciones

Una generalización del problema involucra distribuciones normales multivariadas con matrices de covarianza desconocidas, y se conoce como el problema de Behrens-Fisher multivariante . ^[15]

El problema no paramétrico de Behrens-Fisher no supone que las distribuciones sean normales. ^[16]^[17] Las pruebas incluyen la prueba de Cucconi de 1968 y la prueba de Lepage de 1971.

Notas

↑ Lehmann (1975) p.95
^ Lehmann (1975) Sección 7
^ Fisher, RA (1935). "El argumento fiducial en la inferencia estadística". Anales de la eugenesia . 8 (4): 391–398. doi : 10.1111 / j.1469-1809.1935.tb02120.x . hdl : 2440/15222 .
^ Argumento fiducial de RA Fisher y teorema de Bayes por Teddy Seidenfeld
^ Sezer, A. et al. Comparación de intervalos de confianza para el problema de comunicación de problemas de Behrens-Fisher . Estadísticas. 2015
↑ Welch (1938, 1947)
↑ a b Dudewicz, Ma, Mai y Su (2007)
^ Chapman, DG (1950). "Algunas dos pruebas de muestra" . Anales de estadística matemática . 21 (4): 601–606. doi : 10.1214 / aoms / 1177729755 .
^ Prokof'yev, VN; Shishkin, AD (1974). "Clasificación sucesiva de conjuntos normales con variaciones desconocidas". Radio Engng. Electrón. Phys . 19 (2): 141-143.
^ Dudewicz y Ahmed (1998, 1999)
^ Kabe, DG (diciembre de 1966). "Sobre la distribución exacta de la estadística de Fisher-Behren'-Welch". Metrika . 10 (1): 13-15. doi : 10.1007 / BF02613414 . S2CID 120965543 .
^ Xiao, Yongshun (22 de marzo de 2018). "Sobre la solución de un problema de Behrens-Fisher generalizado" . Far East Journal of Theoretical Statistics . 54 (1): 21–140. doi : 10.17654 / TS054010021 . Consultado el 21 de mayo de 2020 .
^ a b Xiao, Yongshun (12 de diciembre de 2018). "Sobre la solución de un problema de Behrens-Fisher no central con un coeficiente de correlación de población distinta de cero" . Far East Journal of Theoretical Statistics . 54 (6): 527–600. doi : 10.17654 / TS054060527 . Consultado el 21 de mayo de 2020 .
^ Young, GA, Smith, RL (2005) Fundamentos de la inferencia estadística , CUP. ISBN 0-521-83971-8 (página 204)
^ Belloni y Didier (2008)
^ Brunner, E. (2000). "Problema de Behrens-Fisher no paramétrico: teoría asintótica y una pequeña aproximación muestra". Revista biométrica . 42 : 17-25. doi : 10.1002 / (SICI) 1521-4036 (200001) 42: 1 <17 :: AID-BIMJ17> 3.0.CO; 2-U .
^ Konietschke, Frank (2015). "nparcomp: un paquete de software R para comparaciones múltiples no paramétricas e intervalos de confianza simultáneos" . Revista de software estadístico . 64 (9). doi : 10.18637 / jss.v064.i09 . Consultado el 26 de septiembre de 2016 .

Referencias

Behrens, WU (1929). "Ein Beitrag zur Fehlerberechnung bei wenigen Beobachtungen" [Una contribución a la estimación del error con pocas observaciones]. Landwirtschaftliche Jahrbücher . Berlín: Wiegandt y Hempel. 68 : 807–37.
Bellon, A .; Didier, G. (2008). "Sobre el problema de Behrens-Fisher: un algoritmo globalmente convergente y un estudio de muestra finita de las pruebas de Wald, LR y LM". Annals of Statistics . 36 (5): 2377–2408. arXiv : 0811.0672 . doi : 10.1214 / 07-AOS528 . S2CID 15968707 .
Chang, CH; Pal, N (2008). "Una revisión del problema de Behrens-Fisher: comparación de cinco métodos de prueba". Comunicaciones en Estadística-Simulación y Computación . 37 (6): 1064–1085. doi : 10.1080 / 03610910802049599 . S2CID 32811488 .
Dudewicz, EJ; Ahmed, SU (1998). "Nueva solución exacta y asintóticamente óptima al problema de Behrens-Fisher, con tablas". Revista Estadounidense de Ciencias Matemáticas y de Gestión . 18 (3–4): 359–426. doi : 10.1080 / 01966324.1998.10737471 .
Dudewicz, EJ; Ahmed, SU (1999). "Nuevos procedimientos y tablas estadísticos heterocedásticos exactos y asintóticamente óptimos, II". Revista Estadounidense de Ciencias Matemáticas y de Gestión . 19 (1–2): 157–180. doi : 10.1080 / 01966324.1999.10737478 .
Dudewicz, EJ; Mayo.; Mai, SE; Su, H. (2007). "Soluciones exactas al problema de Behrens-Fisher: elección eficiente de muestras finitas y asintóticamente óptimas entre". Revista de Planificación e Inferencia Estadística . 137 (5): 1584–1605. doi : 10.1016 / j.jspi.2006.09.007 .
Fisher, RA (1935). "El argumento fiducial en la inferencia estadística". Anales de la eugenesia . 8 (4): 391–398. doi : 10.1111 / j.1469-1809.1935.tb02120.x . hdl : 2440/15222 .
Fisher, RA (1941). "El enfoque asintótico de la integral de Behrens con más tablas para la prueba d de significancia". Anales de la eugenesia . 11 : 141-172. doi : 10.1111 / j.1469-1809.1941.tb02281.x .
Fraser, DAS; Rousseau, J. (2008). "Studentización y derivación de valores p precisos" . Biometrika . 95 (1): 1–16. doi : 10.1093 / biomet / asm093 .
Lehmann, EL (1975) No paramétricos: métodos estadísticos basados en rangos , Holden-Day ISBN 0-8162-4996-6 , McGraw-Hill ISBN 0-07-037073-7
Ruben, H. (2002) "Una solución simple, conservadora y robusta del problema Behrens-Fisher" , Sankhyā: The Indian Journal of Statistics , Serie A, 64 (1), 139-155.
Pardo, JA; Pardo, MD (2007). "Un estudio de simulación de una nueva familia de estadísticas de prueba para el problema de Behrens-Fisher". Kybernetes . 36 (5–6): 806–816. doi : 10.1108 / 03684920710749866 .
Sawilowsky, Shlomo S (2002). "Fermat, Schubert, Einstein y Behrens-Fisher: la diferencia probable entre dos medias cuando σ 1 ≠ σ 2 " (PDF) . Revista de métodos estadísticos aplicados modernos . 1 (2). doi : 10.22237 / jmasm / 1036109940 . Archivado desde el original (PDF) el 25 de abril de 2012 . Consultado el 8 de marzo de 2012 .
Welch, BL (1938). "La importancia de la diferencia entre dos medias cuando las varianzas poblacionales son desiguales". Biometrika . 29 (3/4): 350–62. doi : 10.2307 / 2332010 . JSTOR 2332010 .
Welch, BL (1947), "La generalización del problema de" Student "cuando se involucran varias variaciones de población diferentes", Biometrika , 34 (1–2): 28–35, doi : 10.1093 / biomet / 34.1-2.28 , MR 0019277 , PMID 20287819
Voinov, V .; Nikulin, M. (1995). "Sobre el problema de los medios de las poblaciones normales ponderadas". Questiio . 19 (2): 7-20.
Zheng, SR; Shi, Nueva Zelanda; Ma, WQ (2010). "Inferencia estadística sobre la diferencia o relación de medias de poblaciones normales heterocedásticas". Revista de Planificación e Inferencia Estadística . 140 (5): 1236-1242. doi : 10.1016 / j.jspi.2009.11.010 .

enlaces externos

Dong, BL (2004) El problema de Behrens-Fisher: un enfoque de probabilidad empírica, documento de trabajo sobre econometría EWP0404, Universidad de Victoria

[1] Lehmann (1975) p.95

[2] Lehmann (1975) Sección 7

[3] Fisher, RA (1935). "El argumento fiducial en la inferencia estadística". Anales de la eugenesia . 8 (4): 391–398. doi : 10.1111 / j.1469-1809.1935.tb02120.x . hdl : 2440/15222 .

[4] Argumento fiducial de RA Fisher y teorema de Bayes por Teddy Seidenfeld

[5] Sezer, A. et al. Comparación de intervalos de confianza para el problema de comunicación de problemas de Behrens-Fisher . Estadísticas. 2015

[6] Welch (1938, 1947)

[DMMS-7] Dudewicz, Ma, Mai y Su (2007)

[8] Chapman, DG (1950). "Algunas dos pruebas de muestra" . Anales de estadística matemática . 21 (4): 601–606. doi : 10.1214 / aoms / 1177729755 .

[9] Prokof'yev, VN; Shishkin, AD (1974). "Clasificación sucesiva de conjuntos normales con variaciones desconocidas". Radio Engng. Electrón. Phys . 19 (2): 141-143.

[10] Dudewicz y Ahmed (1998, 1999)

[11] Kabe, DG (diciembre de 1966). "Sobre la distribución exacta de la estadística de Fisher-Behren'-Welch". Metrika . 10 (1): 13-15. doi : 10.1007 / BF02613414 . S2CID 120965543 .

[12] Xiao, Yongshun (22 de marzo de 2018). "Sobre la solución de un problema de Behrens-Fisher generalizado" . Far East Journal of Theoretical Statistics . 54 (1): 21–140. doi : 10.17654 / TS054010021 . Consultado el 21 de mayo de 2020 .

[Xiao2018b-13] Xiao, Yongshun (12 de diciembre de 2018). "Sobre la solución de un problema de Behrens-Fisher no central con un coeficiente de correlación de población distinta de cero" . Far East Journal of Theoretical Statistics . 54 (6): 527–600. doi : 10.17654 / TS054060527 . Consultado el 21 de mayo de 2020 .

[14] Young, GA, Smith, RL (2005) Fundamentos de la inferencia estadística , CUP. ISBN 0-521-83971-8 (página 204)

[15] Belloni y Didier (2008)

[Brunner2000-16] Brunner, E. (2000). "Problema de Behrens-Fisher no paramétrico: teoría asintótica y una pequeña aproximación muestra". Revista biométrica . 42 : 17-25. doi : 10.1002 / (SICI) 1521-4036 (200001) 42: 1 <17 :: AID-BIMJ17> 3.0.CO; 2-U .

[nparcomp-17] Konietschke, Frank (2015). "nparcomp: un paquete de software R para comparaciones múltiples no paramétricas e intervalos de confianza simultáneos" . Revista de software estadístico . 64 (9). doi : 10.18637 / jss.v064.i09 . Consultado el 26 de septiembre de 2016 .

[1]