Factor Z

El factor Z es una medida del tamaño del efecto estadístico . Se ha propuesto para su uso en el cribado de alto rendimiento (donde también se conoce como Z-prime, ^[1] y comúnmente se escribe como Z 'para juzgar si la respuesta en un ensayo en particular es lo suficientemente grande como para justificar una mayor atención.

Fondo

En las pantallas de alto rendimiento, los experimentadores a menudo comparan una gran cantidad (cientos de miles a decenas de millones) de mediciones únicas de muestras desconocidas con muestras de control positivas y negativas . La elección particular de las condiciones y medidas experimentales se denomina ensayo. Las pantallas grandes son caras en tiempo y recursos. Por lo tanto, antes de iniciar una pantalla grande, se utilizan pantallas de prueba (o piloto) más pequeñas para evaluar la calidad de un ensayo, en un intento de predecir si sería útil en un entorno de alto rendimiento. El factor Z es un intento de cuantificar la idoneidad de un ensayo en particular para su uso en una pantalla de alto rendimiento a gran escala.

Definición

El factor Z se define en términos de cuatro parámetros: las medias ( ${\ Displaystyle \ mu}$ ) y desviaciones estándar ( ${\ Displaystyle \ sigma}$ ) de los controles positivo (p) y negativo (n) ( ${\ Displaystyle \ mu _ {p}}$ , ${\ Displaystyle \ sigma _ {p}}$ , y ${\ Displaystyle \ mu _ {n}}$ , ${\ Displaystyle \ sigma _ {n}}$ ). Dados estos valores, el factor Z se define como:

{\ Displaystyle {\ text {factor Z}} = 1- {3 (\ sigma _ {p} + \ sigma _ {n}) \ over | \ mu _ {p} - \ mu _ {n} |} }

En la práctica, el factor Z se estima a partir de las medias de la muestra y las desviaciones estándar de la muestra.

{\ Displaystyle {\ text {Factor Z estimado}} = 1- {3 ({\ hat {\ sigma}} _ {p} + {\ hat {\ sigma}} _ {n}) \ over | {\ sombrero {\ mu}} _ {p} - {\ sombrero {\ mu}} _ {n} |}}

Interpretación

Las siguientes interpretaciones para el factor Z se toman de: ^[2]

Factor Z	Interpretación
1.0	Ideal. Los factores Z nunca pueden exceder 1.
entre 0,5 y 1,0	Un excelente ensayo. Tenga en cuenta que si ${\ Displaystyle \ sigma _ {p} = \ sigma _ {n}}$ , 0.5 es equivalente a una separación de 12 desviaciones estándar entre ${\ Displaystyle \ mu _ {p}}$ y ${\ Displaystyle \ mu _ {n}}$ .
entre 0 y 0,5	Un ensayo marginal.
menos de 0	Hay demasiada superposición entre los controles positivo y negativo para que el ensayo sea útil.

Tenga en cuenta que según los estándares de muchos tipos de experimentos, un factor Z cero sugeriría un tamaño de efecto grande, en lugar de un resultado inútil límite como se sugirió anteriormente. Por ejemplo, si σ _p = σ _n = 1, entonces μ _p = 6 y μ _n = 0 da un factor Z cero. Pero para datos distribuidos normalmente con estos parámetros, la probabilidad de que el valor de control positivo sea menor que el valor de control negativo es menor que 1 en 10 ⁵ . El conservadurismo extremo se utiliza en el cribado de alto rendimiento debido a la gran cantidad de pruebas realizadas.

Limitaciones

El factor constante 3 en la definición del factor Z está motivado por la distribución normal , para la cual más del 99% de los valores ocurren dentro de 3 desviaciones estándar de la media. Si los datos siguen una distribución fuertemente anormal, los puntos de referencia (por ejemplo, el significado de un valor negativo) pueden ser engañosos. Otro problema es que las estimaciones habituales de la media y la desviación estándar no son sólidas ; en consecuencia, muchos usuarios de la comunidad de cribado de alto rendimiento prefieren el "Z-prime robusto", que sustituye la mediana por la media y la mediana de la desviación absoluta por la desviación estándar. ^[3] Los valores extremos (valores atípicos) en los controles positivos o negativos pueden afectar adversamente el factor Z, lo que podría conducir a un factor Z aparentemente desfavorable incluso cuando el ensayo funcionaría bien en la detección real. ^[4] Además, la aplicación del criterio único basado en el factor Z a dos o más controles positivos con diferentes concentraciones en el mismo ensayo dará lugar a resultados engañosos. ^[5] El signo absoluto en el factor Z hace que sea inconveniente derivar matemáticamente la inferencia estadística del factor Z ^[6] . Un parámetro estadístico propuesto recientemente, la diferencia de medias estrictamente estandarizada ( SSMD ), puede abordar estos problemas ^[5]^[6]^[7] . Una estimación de SSMD es robusta a valores atípicos.

Ver también

Referencias

^ http://planetorbitrap.com/data/uploads/4fb692e73c07b.pdf
^ Zhang JH, Chung TDY, Oldenburg KR (1999). "Un parámetro estadístico simple para su uso en la evaluación y validación de ensayos de cribado de alto rendimiento". Revista de cribado biomolecular . 4 : 67–73. doi : 10.1177 / 108705719900400206 . PMID 10838414 .
^ Birmingham, Amanda; et al. (Agosto de 2009). "Métodos estadísticos para el análisis de pantallas de interferencia de ARN de alto rendimiento" . Métodos Nat . 6 (8): 569–575. doi : 10.1038 / nmeth.1351 . PMC 2789971 . PMID 19644458 .
^ Sui Y, Wu Z (2007). "Parámetro estadístico alternativo para la evaluación de la calidad del ensayo de detección de alto rendimiento" . Revista de cribado biomolecular . 12 : 229–34. doi : 10.1177 / 1087057106296498 . PMID 17218666 .
^ a b Zhang XHD, Espeseth AS, Johnson E, Chin J, Gates A, Mitnaul L, Marine SD, Tian J, Stec EM, Kunapuli P, Holder DJ, Heyse JF, Stulovici B, Ferrer M (2008). "Integración de enfoques experimentales y analíticos para mejorar la calidad de los datos en pantallas de ARNi en todo el genoma". Revista de cribado biomolecular . 13 : 378–89. doi : 10.1177 / 1087057108317145 . PMID 18480473 .
^ a b Zhang XHD (2007). "Un par de nuevos parámetros estadísticos para el control de calidad en ensayos de cribado de alto rendimiento de interferencia de ARN". Genómica . 89 : 552–61. doi : 10.1016 / j.ygeno.2006.12.014 . PMID 17276655 .
^ Zhang XHD (2008). "Nuevos criterios analíticos y diseños de placas eficaces para el control de calidad en pantallas de ARNi de todo el genoma". Revista de cribado biomolecular . 13 : 363–77. doi : 10.1177 / 1087057108317062 . PMID 18567841 .

Otras lecturas

Kraybill, B. (2005) "Evaluación y optimización de ensayos cuantitativos" (nota no publicada)
Zhang XHD (2011) "Detección de alto rendimiento óptimo: diseño experimental práctico y análisis de datos para la investigación de ARNi a escala genómica, Cambridge University Press"

[1] ttp://planetorbitrap.com/data/uploads/4fb692e73c07b.pdf

[ZhangJHetal1999-2] Zhang JH, Chung TDY, Oldenburg KR (1999). "Un parámetro estadístico simple para su uso en la evaluación y validación de ensayos de cribado de alto rendimiento". Revista de cribado biomolecular . 4 : 67–73. doi : 10.1177 / 108705719900400206 . PMID 10838414 .

[3] Birmingham, Amanda; et al. (Agosto de 2009). "Métodos estadísticos para el análisis de pantallas de interferencia de ARN de alto rendimiento" . Métodos Nat . 6 (8): 569–575. doi : 10.1038 / nmeth.1351 . PMC 2789971 . PMID 19644458 .

[Sui2007-4] Sui Y, Wu Z (2007). "Parámetro estadístico alternativo para la evaluación de la calidad del ensayo de detección de alto rendimiento" . Revista de cribado biomolecular . 12 : 229–34. doi : 10.1177 / 1087057106296498 . PMID 17218666 .

[ZhangetalJBS2008-5] Zhang XHD, Espeseth AS, Johnson E, Chin J, Gates A, Mitnaul L, Marine SD, Tian J, Stec EM, Kunapuli P, Holder DJ, Heyse JF, Stulovici B, Ferrer M (2008). "Integración de enfoques experimentales y analíticos para mejorar la calidad de los datos en pantallas de ARNi en todo el genoma". Revista de cribado biomolecular . 13 : 378–89. doi : 10.1177 / 1087057108317145 . PMID 18480473 .

[ZhangGenomics2007-6] Zhang XHD (2007). "Un par de nuevos parámetros estadísticos para el control de calidad en ensayos de cribado de alto rendimiento de interferencia de ARN". Genómica . 89 : 552–61. doi : 10.1016 / j.ygeno.2006.12.014 . PMID 17276655 .

[ZhangJBS2008-7] Zhang XHD (2008). "Nuevos criterios analíticos y diseños de placas eficaces para el control de calidad en pantallas de ARNi de todo el genoma". Revista de cribado biomolecular . 13 : 363–77. doi : 10.1177 / 1087057108317062 . PMID 18567841 .

[1]