Prueba de McNemar

En estadística , la prueba de McNemar es una prueba estadística que se utiliza con datos nominales emparejados . Se aplica a tablas de contingencia 2 × 2 con un rasgo dicotómico , con pares de sujetos emparejados, para determinar si las frecuencias marginales de fila y columna son iguales (es decir, si existe "homogeneidad marginal"). Lleva el nombre de Quinn McNemar , quien lo introdujo en 1947. ^[1] Una aplicación de la prueba en genética es la prueba de desequilibrio de transmisión para detectar desequilibrio de ligamiento . ^[2]Los parámetros comúnmente utilizados para evaluar una prueba de diagnóstico en las ciencias médicas son la sensibilidad y la especificidad. La sensibilidad es la capacidad de una prueba para identificar correctamente a las personas con la enfermedad. La especificidad es la capacidad de la prueba para identificar correctamente a quienes no tienen la enfermedad. Ahora suponga que se realizan dos pruebas en el mismo grupo de pacientes. Y también suponga que estas pruebas tienen idéntica sensibilidad y especificidad. En esta situación uno se deja llevar por estos hallazgos y supone que ambas pruebas son equivalentes. Sin embargo, puede que éste no sea el caso. Para ello tenemos que estudiar a los pacientes con enfermedad y a los pacientes sin enfermedad (mediante una prueba de referencia). También tenemos que averiguar dónde están en desacuerdo estas dos pruebas. Esta es precisamente la base de la prueba de McNemar. Esta prueba compara la sensibilidad y la especificidad de dos pruebas de diagnóstico en el mismo grupo de pacientes. ^[3]

Definición

La prueba se aplica a una tabla de contingencia de 2 × 2, que tabula los resultados de dos pruebas en una muestra de N sujetos, de la siguiente manera.

	Prueba 2 positiva	Prueba 2 negativa	Total de filas
Prueba 1 positiva	a	B	a + b
Prueba 1 negativa	C	D	c + d
Total de la columna	a + c	b + d	norte

La hipótesis nula de homogeneidad marginal establece que las dos probabilidades marginales para cada resultado son iguales, es decir, p _a + p _b = p _a + p _c y p _c + p _d = p _b + p _d .

Por tanto, las hipótesis nula y alternativa son ^[1]

{\ Displaystyle {\ begin {alineado} H_ {0} &: ~ p_ {b} = p_ {c} \\ H_ {1} &: ~ p_ {b} \ neq p_ {c} \ end {alineado}} }

Aquí p _a , etc., denotan la probabilidad teórica de ocurrencias en celdas con la etiqueta correspondiente.

La estadística de la prueba de McNemar es:

{\ Displaystyle \ chi ^ {2} = {(bc) ^ {2} \ over b + c}.}

Bajo la hipótesis nula, con un número suficientemente grande de discordantes (celdas byc), ${\ Displaystyle \ chi ^ {2}}$ tiene una distribución chi-cuadrado con 1 grado de libertad . Si el ${\ Displaystyle \ chi ^ {2}}$ El resultado es significativo , esto proporciona evidencia suficiente para rechazar la hipótesis nula, a favor de la hipótesis alternativa de que p _b ≠ p _c , lo que significaría que las proporciones marginales son significativamente diferentes entre sí.

Variaciones

Si b o c es pequeño ( b + c <25) entonces ${\ Displaystyle \ chi ^ {2}}$ no está bien aproximado por la distribución chi-cuadrado. ^{[ Citación necesaria ]} Una prueba exacta binomial se puede entonces utilizar, donde b es comparada con una distribución binomial con parámetro de tamaño n = b + c y p = 0,5. Efectivamente, la prueba exacta binomial evalúa el desequilibrio en los discordants b y c . Para lograr un valor P de dos caras, el valor P de la cola extrema debe multiplicarse por 2. Para b ≥ c :

{\ Displaystyle {\ text {valor-P-exacto}} = 2 \ sum _ {i = b} ^ {n} {n \ elija i} 0.5 ^ {i} (1-0.5) ^ {ni},}

que es simplemente el doble de la función de distribución acumulada de distribución binomial con p = 0.5 yn = b + c .

Edwards ^[4] propuso la siguiente versión corregida de continuidad de la prueba de McNemar para aproximar el binomio exacto-valor-P:

{\ Displaystyle \ chi ^ {2} = {(| bc | -1) ^ {2} \ over b + c}.}

La prueba de McNemar mid-P (prueba binomial mid-p) se calcula restando la mitad de la probabilidad de la b observada del valor P unilateral exacto, luego duplíquelo para obtener el valor P medio bilateral: ^{[ 5]}^[6]

{\ Displaystyle {\ text {mid-p-value}} = 2 \ left (\ sum _ {i = b} ^ {n} {n \ elija i} 0.5 ^ {i} (1-0.5) ^ {ni } -0.5 {n \ elija b} 0.5 ^ {b} (1-0.5) ^ {nb} \ right)}

Esto es equivalente a:

{\ Displaystyle {\ text {mid-p-value}} = {\ text {exacta-p-value}} - {n \ choose b} 0.5 ^ {b} (1-0.5) ^ {nb}}

donde el segundo término es la función de masa de probabilidad de distribución binomial y n = b + c . Las funciones de distribución binomial están fácilmente disponibles en paquetes de software comunes y la prueba mid-P de McNemar se puede calcular fácilmente. ^[6]

El consejo tradicional ha sido utilizar la prueba binomial exacta cuando b + c <25. Sin embargo, las simulaciones han demostrado que tanto la prueba binomial exacta como la prueba de McNemar con corrección de continuidad son demasiado conservadoras. ^[6] Cuando b + c <6, el valor-P-exacto siempre excede el nivel de significancia común 0.05. La prueba original de McNemar fue la más poderosa, pero a menudo ligeramente liberal. La versión mid-P fue casi tan poderosa como la prueba asintótica de McNemar y no se encontró que excediera el nivel de significancia nominal.

Ejemplos de

En el primer ejemplo, un investigador intenta determinar si un medicamento tiene un efecto sobre una enfermedad en particular. Los recuentos de individuos se dan en la tabla, con el diagnóstico (enfermedad: presente o ausente ) antes del tratamiento en las filas y el diagnóstico después del tratamiento en las columnas. La prueba requiere que se incluyan los mismos sujetos en las mediciones de antes y después (pares emparejados).

	Después: presente	Después: ausente	Total de filas
Antes: presente	101	121	222
Antes: ausente	59	33	92
Total de la columna	160	154	314

En este ejemplo, la hipótesis nula de "homogeneidad marginal" significaría que no hubo efecto del tratamiento. A partir de los datos anteriores, la estadística de prueba de McNemar:

{\ Displaystyle \ chi ^ {2} = {(121-59) ^ {2} \ over {121 + 59}}}

tiene el valor 21,35, que es extremadamente improbable que forme la distribución implícita en la hipótesis nula ( P <0,001). Por lo tanto, la prueba proporciona pruebas sólidas para rechazar la hipótesis nula de ningún efecto del tratamiento.

Un segundo ejemplo ilustra las diferencias entre la prueba asintótica de McNemar y las alternativas. ^[6] La tabla de datos tiene el mismo formato que antes, con diferentes números en las celdas:

	Después: presente	Después: ausente	Total de filas
Antes: presente	59	6	sesenta y cinco
Antes: ausente	dieciséis	80	96
Total de la columna	75	86	161

Con estos datos, el tamaño de la muestra (161 pacientes) no es pequeño, sin embargo, los resultados de la prueba de McNemar y otras versiones son diferentes. La prueba binomial exacta da P = 0.053 y la prueba de McNemar con corrección de continuidad da ${\ Displaystyle \ chi ^ {2}}$ = 3,68 y P = 0,055. La prueba asintótica de McNemar da ${\ Displaystyle \ chi ^ {2}}$ = 4.55 y P = 0.033 y la prueba de McNemar de P media da P = 0.035. Tanto la prueba de McNemar como la versión mid-P proporcionan evidencia más sólida de un efecto de tratamiento estadísticamente significativo en este segundo ejemplo.

Discusión

Una observación interesante al interpretar la prueba de McNemar es que los elementos de la diagonal principal no contribuyen a la decisión sobre si (en el ejemplo anterior) la condición previa o posterior al tratamiento es más favorable. Por lo tanto, la suma b + c puede ser pequeña y la potencia estadística de las pruebas descritas anteriormente puede ser baja aunque el número de pares a + b + c + d sea grande (ver el segundo ejemplo anterior).

Existe una extensión de la prueba de McNemar en situaciones en las que la independencia no se cumple necesariamente entre las parejas; en cambio, hay grupos de datos emparejados en los que los pares de un grupo pueden no ser independientes, pero la independencia se mantiene entre diferentes grupos. ^[7] Un ejemplo es analizar la efectividad de un procedimiento dental; en este caso, un par corresponde al tratamiento de un diente individual en pacientes que pueden tener varios dientes tratados; No es probable que la eficacia del tratamiento de dos dientes en el mismo paciente sea independiente, pero es más probable que el tratamiento de dos dientes en pacientes diferentes sea independiente. ^[8]

Información en los maridajes

En la década de 1970, se conjeturó que retener las amígdalas podría proteger contra el linfoma de Hodgkin . John Rice escribió: ^[9]

85 Los pacientes de Hodgkin [...] tenían un hermano del mismo sexo que estaba libre de la enfermedad y cuya edad estaba dentro de los 5 años de la del paciente. Estos investigadores presentaron la siguiente tabla:
${\ displaystyle {\ begin {array} {c | c | c} \ hline & {\ text {Amigdalectomía}} & {\ text {Sin amigdalectomía}} \\\ hline {\ text {Hodgkins}} & 41 & 44 \\\ hline {\ text {Control}} & 33 & 52 \ end {array}}}$
Ellos calcularon una estadística de chi-cuadrado [...] [ellos] habían cometido un error en su análisis al ignorar los emparejamientos. [...] [sus] muestras no eran independientes, porque los hermanos estaban emparejados [...] configuramos una mesa que exhibe los emparejamientos:
${\ Displaystyle {\ begin {array} {cc} & {\ text {Hermano}} \\ {\ text {Paciente}} & {\ begin {array} {c | c | c} \ hline & {\ text { Sin amigdalectomía}} & {\ text {Amigdalectomía}} \\\ hline {\ text {Sin amigdalectomía}} & 37 & 7 \\\ hline {\ text {Amigdalectomía}} & 15 & 26 \ end {array}} \ end {array}}}$

Es en la segunda tabla donde se puede aplicar la prueba de McNemar. Observe que la suma de los números en la segunda tabla es 85 — el número de pares de hermanos — mientras que la suma de los números en la primera tabla es dos veces mayor, 170 — el número de individuos. La segunda tabla proporciona más información que la primera. Los números de la primera tabla se pueden encontrar usando los números de la segunda tabla, pero no al revés. Los números de la primera tabla dan solo los totales marginales de los números de la segunda tabla.

Pruebas relacionadas

La prueba del signo binomial proporciona una prueba exacta para la prueba de McNemar.
La prueba Q de Cochran es una extensión de la prueba de McNemar para más de dos "tratamientos".
La prueba exacta de Liddell es una alternativa exacta a la prueba de McNemar. ^[10]^[11]
La prueba de Stuart-Maxwell es una generalización diferente de la prueba de McNemar, utilizada para probar la homogeneidad marginal en una tabla cuadrada con más de dos filas / columnas. ^[12]^[13]^[14]
La prueba de Bhapkar (1966) es una alternativa más poderosa que la prueba de Stuart-Maxwell, ^[15]^[16] pero tiende a ser liberal. Se encuentran disponibles alternativas competitivas a los métodos existentes. ^[17]
La prueba de McNemar es un caso especial de la prueba de Cochran-Mantel-Haenszel ; es equivalente a una prueba de CMH con un estrato para cada uno de los N pares y, en cada estrato, una tabla de 2x2 que muestra las respuestas binarias pareadas. ^[18]

Ver también

Prueba de chi-cuadrado de Pearson
Distribución chi-cuadrado

Referencias

↑ a b McNemar, Quinn (18 de junio de 1947). "Nota sobre el error muestral de la diferencia entre proporciones o porcentajes correlacionados". Psychometrika . 12 (2): 153-157. doi : 10.1007 / BF02295996 . PMID 20254758 .
^ Spielman RS; McGinnis RE; Ewens WJ (marzo de 1993). "Prueba de transmisión para el desequilibrio de ligamiento: la región del gen de la insulina y la diabetes mellitus insulinodependiente (IDDM)" . Soy J Hum Genet . 52 (3): 506–16. PMC 1682161 . PMID 8447318 .
^ Hawass, NE (abril de 1997). "Comparando las sensibilidades y especificidades de dos procedimientos diagnósticos realizados en el mismo grupo de pacientes". La Revista Británica de Radiología . 70 (832): 360–366. doi : 10.1259 / bjr.70.832.9166071 . ISSN 0007-1285 . PMID 9166071 .
^ Edwards, A (1948). "Nota sobre la" corrección por continuidad "al probar la importancia de la diferencia entre proporciones correlacionadas". Psychometrika . 13 (3): 185–187. doi : 10.1007 / bf02289261 . PMID 18885738 .
^ Lancaster, HO (1961). "Pruebas de significancia en distribuciones discretas". J Am Stat Assoc . 56 (294): 223–234. doi : 10.1080 / 01621459.1961.10482105 .
^ a b c d Fagerland, MW; Lydersen, S .; Laake, P. (2013). "La prueba de McNemar para datos de pares emparejados binarios: mid-p y asintóticos son mejores que el condicional exacto" . Metodología de Investigación Médica de BMC . 13 : 91. doi : 10.1186 / 1471-2288-13-91 . PMC 3716987 . PMID 23848987 .
^ Yang, Z .; Sol, X .; Hardin, JW (2010). "Una nota sobre las pruebas para datos binarios agrupados de pares coincidentes". Revista biométrica . 52 (5): 638–652. doi : 10.1002 / bimj.201000035 . PMID 20976694 .
^ Durkalski, VL; Palesch, YY; Lipsitz, SR; Óxido, PF (2003). "Análisis de datos agrupados de pares coincidentes" . Estadística en Medicina . 22 (15): 2417-28. doi : 10.1002 / sim.1438 . PMID 12872299 . Archivado desde el original el 5 de enero de 2013 . Consultado el 1 de abril de 2009 .
^ Rice, John (1995). Estadística matemática y análisis de datos (Segunda ed.). Belmont, California: Duxbury Press . págs. 492 –494. ISBN 978-0-534-20934-6.
^ Liddell, D. (1976). "Pruebas prácticas de tablas de contingencia 2 × 2". Revista de la Royal Statistical Society . 25 (4): 295-304. JSTOR 2988087 .
^ "Prueba de Maxwell, prueba de McNemar, prueba de Kappa" . Rimarcik.com . Consultado el 22 de noviembre de 2012 .
^ Sun, Xuezheng; Yang, Zhao (2008). "Prueba generalizada de McNemar para la homogeneidad de las distribuciones marginales" (PDF) . Foro Global SAS .
^ Stuart, Alan (1955). "Una prueba de homogeneidad de las distribuciones marginales en una clasificación bidireccional". Biometrika . 42 (3/4): 412–416. doi : 10.1093 / biomet / 42.3-4.412 . JSTOR 2333387 .
^ Maxwell, AE (1970). "Comparación de la clasificación de sujetos por dos jueces independientes". La Revista Británica de Psiquiatría . 116 (535): 651–655. doi : 10.1192 / bjp.116.535.651 . PMID 5452368 .
^ "Pruebas de McNemar de homogeneidad marginal" . John-uebersax.com. 2006-08-30 . Consultado el 22 de noviembre de 2012 .
^ Bhapkar, vicepresidente (1966). "Una nota sobre la equivalencia de dos criterios de prueba para hipótesis en datos categóricos". Revista de la Asociación Estadounidense de Estadística . 61 (313): 228–235. doi : 10.1080 / 01621459.1966.10502021 . JSTOR 2283057 .
^ Yang, Z .; Sol, X .; Hardin, JW (2012). "Prueba de homogeneidad marginal en datos politómicos de pares coincidentes". Innovación terapéutica y ciencia reguladora . 46 (4): 434–438. doi : 10.1177 / 0092861512442021 .
^ Agresti, Alan (2002). Análisis de datos categóricos (PDF) . Hooken, Nueva Jersey: John Wiley & Sons, Inc. p. 413. ISBN 978-0-471-36093-3.

enlaces externos

Cuadrícula McNemar 2 × 2 de Vassar College con calculadora en línea
Pruebas de McNemar de homogeneidad marginal

[McNemar1947-1] McNemar, Quinn (18 de junio de 1947). "Nota sobre el error muestral de la diferencia entre proporciones o porcentajes correlacionados". Psychometrika . 12 (2): 153-157. doi : 10.1007 / BF02295996 . PMID 20254758 .

[Spielman93-2] Spielman RS; McGinnis RE; Ewens WJ (marzo de 1993). "Prueba de transmisión para el desequilibrio de ligamiento: la región del gen de la insulina y la diabetes mellitus insulinodependiente (IDDM)" . Soy J Hum Genet . 52 (3): 506–16. PMC 1682161 . PMID 8447318 .

[3] Hawass, NE (abril de 1997). "Comparando las sensibilidades y especificidades de dos procedimientos diagnósticos realizados en el mismo grupo de pacientes". La Revista Británica de Radiología . 70 (832): 360–366. doi : 10.1259 / bjr.70.832.9166071 . ISSN 0007-1285 . PMID 9166071 .

[Edwards1948-4] Edwards, A (1948). "Nota sobre la" corrección por continuidad "al probar la importancia de la diferencia entre proporciones correlacionadas". Psychometrika . 13 (3): 185–187. doi : 10.1007 / bf02289261 . PMID 18885738 .

[Lancaster1961-5] Lancaster, HO (1961). "Pruebas de significancia en distribuciones discretas". J Am Stat Assoc . 56 (294): 223–234. doi : 10.1080 / 01621459.1961.10482105 .

[Fagerland2013-6] Fagerland, MW; Lydersen, S .; Laake, P. (2013). "La prueba de McNemar para datos de pares emparejados binarios: mid-p y asintóticos son mejores que el condicional exacto" . Metodología de Investigación Médica de BMC . 13 : 91. doi : 10.1186 / 1471-2288-13-91 . PMC 3716987 . PMID 23848987 .

[7] Yang, Z .; Sol, X .; Hardin, JW (2010). "Una nota sobre las pruebas para datos binarios agrupados de pares coincidentes". Revista biométrica . 52 (5): 638–652. doi : 10.1002 / bimj.201000035 . PMID 20976694 .

[8] Durkalski, VL; Palesch, YY; Lipsitz, SR; Óxido, PF (2003). "Análisis de datos agrupados de pares coincidentes" . Estadística en Medicina . 22 (15): 2417-28. doi : 10.1002 / sim.1438 . PMID 12872299 . Archivado desde el original el 5 de enero de 2013 . Consultado el 1 de abril de 2009 .

[Rice1995-9] Rice, John (1995). Estadística matemática y análisis de datos (Segunda ed.). Belmont, California: Duxbury Press . págs. 492 –494. ISBN 978-0-534-20934-6.

[10] Liddell, D. (1976). "Pruebas prácticas de tablas de contingencia 2 × 2". Revista de la Royal Statistical Society . 25 (4): 295-304. JSTOR 2988087 .

[11] "Prueba de Maxwell, prueba de McNemar, prueba de Kappa" . Rimarcik.com . Consultado el 22 de noviembre de 2012 .

[12] Sun, Xuezheng; Yang, Zhao (2008). "Prueba generalizada de McNemar para la homogeneidad de las distribuciones marginales" (PDF) . Foro Global SAS .

[13] Stuart, Alan (1955). "Una prueba de homogeneidad de las distribuciones marginales en una clasificación bidireccional". Biometrika . 42 (3/4): 412–416. doi : 10.1093 / biomet / 42.3-4.412 . JSTOR 2333387 .

[14] Maxwell, AE (1970). "Comparación de la clasificación de sujetos por dos jueces independientes". La Revista Británica de Psiquiatría . 116 (535): 651–655. doi : 10.1192 / bjp.116.535.651 . PMID 5452368 .

[15] "Pruebas de McNemar de homogeneidad marginal" . John-uebersax.com. 2006-08-30 . Consultado el 22 de noviembre de 2012 .

[16] Bhapkar, vicepresidente (1966). "Una nota sobre la equivalencia de dos criterios de prueba para hipótesis en datos categóricos". Revista de la Asociación Estadounidense de Estadística . 61 (313): 228–235. doi : 10.1080 / 01621459.1966.10502021 . JSTOR 2283057 .

[17] Yang, Z .; Sol, X .; Hardin, JW (2012). "Prueba de homogeneidad marginal en datos politómicos de pares coincidentes". Innovación terapéutica y ciencia reguladora . 46 (4): 434–438. doi : 10.1177 / 0092861512442021 .

[18] Agresti, Alan (2002). Análisis de datos categóricos (PDF) . Hooken, Nueva Jersey: John Wiley & Sons, Inc. p. 413. ISBN 978-0-471-36093-3.

[1]