En estadística , una transformación de potencia es una familia de funciones aplicadas para crear una transformación monótona de datos utilizando funciones de potencia . Es una técnica de transformación de datos que se utiliza para estabilizar la varianza, hacer que los datos tengan una distribución más normal , mejorar la validez de las medidas de asociación (como la correlación de Pearson entre variables) y para otros procedimientos de estabilización de datos.
Las transformaciones de potencia se utilizan en múltiples campos, incluido el análisis de ondas múltiples y de resolución múltiple , [1] análisis de datos estadísticos, investigación médica, modelado de procesos físicos, [2] análisis de datos geoquímicos , [3] epidemiología [4] y muchos otros aspectos clínicos, áreas de investigación ambiental y social.
Definición
La transformación de potencia se define como una función que varía continuamente, con respecto al parámetro de potencia λ , en una forma de función por partes que la hace continua en el punto de singularidad ( λ = 0). Para vectores de datos ( y 1 , ..., y n ) en los que cada y i > 0, la transformada de potencia es
dónde
es la media geométrica de las observaciones y 1 , ..., y n . El caso por es el limite como se acerca a 0. Para ver esto, tenga en cuenta que = . Luego = , y todo menos se vuelve insignificante para suficientemente pequeño.
La inclusión de la ( λ - 1) -ésima potencia de la media geométrica en el denominador simplifica la interpretación científica de cualquier ecuación que involucre , porque las unidades de medida no cambian a medida que cambia λ .
Box y Cox (1964) introdujeron la media geométrica en esta transformación al incluir primero el jacobiano de la transformación de poder reescalada
- .
con la probabilidad. Este jacobiano es el siguiente:
Esto permite que la probabilidad de registro normal en su máximo se escriba de la siguiente manera:
A partir de aquí, absorbiendo en la expresión de produce una expresión que establece que minimizar la suma de cuadrados de los residuos dees equivalente a maximizar la suma de la probabilidad logarítmica normal de las desviaciones de y el registro del jacobiano de la transformación.
El valor en Y = 1 para cualquier λ es 0, y la derivada con respecto a Y es 1 para cualquier λ . A veces, Y es una versión de alguna otra variable escalada para dar Y = 1 en algún tipo de valor promedio.
La transformación es una transformación de potencia , pero realizada de manera que sea continua con el parámetro λ en λ = 0. Ha demostrado ser popular en el análisis de regresión , incluida la econometría .
Box y Cox también propusieron una forma más general de transformación que incorpora un parámetro de desplazamiento.
que se cumple si y i + α> 0 para todo i . Si τ ( Y , λ, α) sigue una distribución normal truncada , entonces se dice que Y sigue una distribución Box-Cox .
Bickel y Doksum eliminaron la necesidad de usar una distribución truncada al extender el rango de la transformación a todo y , de la siguiente manera:
- ,
donde sgn (.) es la función de signo . Este cambio en la definición tiene poca importancia práctica siempre que es menos que , que suele ser. [5]
Bickel y Doksum también demostraron que las estimaciones de los parámetros son consistentes y asintóticamente normales en condiciones de regularidad apropiadas, aunque el límite inferior estándar de Cramér-Rao puede subestimar sustancialmente la varianza cuando los valores de los parámetros son pequeños en relación con la varianza del ruido. [5] Sin embargo, este problema de subestimar la varianza puede no ser un problema sustancial en muchas aplicaciones. [6] [7]
Transformación de Box-Cox
Las transformaciones de Box-Cox de un parámetro se definen como
y las transformaciones de Box-Cox de dos parámetros como
como se describe en el artículo original. [8] [9] Además, las primeras transformaciones son válidas para, y el segundo para . [8]
El parámetro se estima usando la función de probabilidad del perfil y usando pruebas de bondad de ajuste. [10]
Intervalo de confianza
El intervalo de confianza para la transformación de Box-Cox se puede construir asintóticamente utilizando el teorema de Wilks sobre la función de verosimilitud del perfil para encontrar todos los valores posibles deque cumplen la siguiente restricción: [11]
Ejemplo
El conjunto de datos hepáticos BUPA [12] contiene datos sobre las enzimas hepáticas ALT y γGT . Suponga que estamos interesados en usar log (γGT) para predecir ALT. Un gráfico de los datos aparece en el panel (a) de la figura. Parece haber una varianza no constante y una transformación de Box-Cox podría ayudar.
La probabilidad logarítmica del parámetro de potencia aparece en el panel (b). La línea de referencia horizontal está a una distancia de χ 1 2 /2 desde el máximo y se puede utilizar para leer fuera de un intervalo de confianza del 95% aproximado para λ. Parece que un valor cercano a cero sería bueno, por lo que tomamos registros.
Posiblemente, la transformación podría mejorarse agregando un parámetro de cambio a la transformación de registro. El panel (c) de la figura muestra la probabilidad logarítmica. En este caso, el máximo de probabilidad está cerca de cero, lo que sugiere que no se necesita un parámetro de cambio. El panel final muestra los datos transformados con una línea de regresión superpuesta.
Tenga en cuenta que, aunque las transformaciones de Box-Cox pueden generar grandes mejoras en el ajuste del modelo, hay algunos problemas con los que la transformación no puede ayudar. En el ejemplo actual, los datos son bastante complicados, por lo que el supuesto de normalidad no es realista y un enfoque de regresión robusto conduce a un modelo más preciso.
Aplicación econométrica
Los economistas suelen caracterizar las relaciones de producción mediante alguna variante de la transformación Box-Cox. [13]
Considere una representación común de la producción Q como dependiente de los servicios proporcionados por un capital social K y por las horas de trabajo N :
Resolviendo para Q invirtiendo la transformación de Box-Cox encontramos
que se conoce como función de producción de elasticidad constante de sustitución (CES) .
La función de producción de CES es una función homogénea de grado uno.
Cuando λ = 1, esto produce la función de producción lineal:
Cuando λ → 0 esto produce la famosa función de producción Cobb-Douglas :
Actividades y demostraciones
Las páginas de recursos de SOCR contienen una serie de actividades interactivas prácticas [14] que demuestran la transformación de Box-Cox (potencia) utilizando gráficos y subprogramas de Java. Estos ilustran directamente los efectos de esta transformación en gráficos QQ , gráficos de dispersión XY , gráficos de series de tiempo e histogramas .
Transformación de Yeo – Johnson
La transformación de Yeo-Johnson [15] permite también valores cero y negativos de. puede ser cualquier número real, donde produce la transformación de la identidad. La ley de transformación dice:
Notas
- ^ Gao, Peisheng; Wu, Weilin (2006). "Clasificación de perturbaciones de la calidad de la energía utilizando máquinas de vectores de soporte y wavelet". Actas de la Sexta Conferencia Internacional sobre Diseño y Aplicaciones de Sistemas Inteligentes - Volumen 01 . ISDA '06. Washington, DC, EE.UU .: IEEE Computer Society. 1 : 201–206. doi : 10.1109 / ISDA.2006.217 . ISBN 9780769525280.
- ^ Gluzman, S .; Yukalov, VI (1 de enero de 2006). "El poder auto-similar se transforma en problemas de extrapolación". Revista de Química Matemática . 39 (1): 47–56. arXiv : cond-mat / 0606104 . Código bibliográfico : 2006cond.mat..6104G . doi : 10.1007 / s10910-005-9003-7 . ISSN 1572-8897 .
- ^ Howarth, RJ; Earle, SAM (1 de febrero de 1979). "Aplicación de una transformación energética generalizada a datos geoquímicos". Revista de la Asociación Internacional de Geología Matemática . 11 (1): 45–62. doi : 10.1007 / BF01043245 . ISSN 1573-8868 .
- ^ Peters, JL; Rushton, L .; Sutton, AJ; Jones, DR; Abrams, KR; Mugglestone, MA (2005). "Métodos bayesianos para la síntesis de diseño cruzado de evidencia epidemiológica y toxicológica". Revista de la Sociedad Real de Estadística, Serie C . 54 : 159-172. doi : 10.1111 / j.1467-9876.2005.00476.x .
- ^ a b Bickel, Peter J .; Doksum, Kjell A. (junio de 1981). "Un análisis de las transformaciones revisadas". Revista de la Asociación Estadounidense de Estadística . 76 (374): 296–311. doi : 10.1080 / 01621459.1981.10477649 .
- ^ Sakia, RM (1992), "La técnica de transformación de Box-Cox: una revisión", The Statistician , 41 (2): 169-178, CiteSeerX 10.1.1.469.7176 , doi : 10.2307 / 2348250 , JSTOR 2348250
- ^ Li, Fengfei (11 de abril de 2005), Box – Cox Transformations: An Overview (PDF) (presentación de diapositivas), Sao Paulo, Brasil: Universidad de Sao Paulo, Brasil , consultado el 2 de noviembre de 2014
- ^ a b Caja, George EP ; Cox, RD (1964). "Un análisis de transformaciones". Revista de la Sociedad Real de Estadística, Serie B . 26 (2): 211–252. JSTOR 2984418 . Señor 0192611 .
- ^ Johnston, J. (1984). Métodos econométricos (Tercera ed.). Nueva York: McGraw-Hill. págs. 61–74. ISBN 978-0-07-032685-9.
- ^ Asar, O .; Ilk, O .; Dag, O. (2017). "Estimación del parámetro de transformación de potencia de Box-Cox mediante pruebas de bondad de ajuste". Comunicaciones en Estadística - Simulación y Computación . 46 (1): 91-105. arXiv : 1401,3812 . doi : 10.1080 / 03610918.2014.957839 .
- ^ Abramovich, Felix; Ritov, Ya'acov (2013). Teoría estadística: una introducción concisa . Prensa CRC. págs. 121-122. ISBN 978-1-4398-5184-5.
- ^ Conjunto de datos de trastorno hepático BUPA
- ^ Zarembka, P. (1974). "Transformación de Variables en Econometría". Fronteras en Econometría . Nueva York: Academic Press. págs. 81-104. ISBN 0-12-776150-0.
- ^ Gráficos de familia de transformación de energía , páginas web de SOCR
- ^ Yeo, In-Kwon; Johnson, Richard A. (2000). "Una nueva familia de transformaciones de energía para mejorar la normalidad o la simetría". Biometrika . 87 (4): 954–959. doi : 10.1093 / biomet / 87.4.954 . JSTOR 2673623 .
Referencias
- Caja, George EP ; Cox, RD (1964). "Un análisis de transformaciones". Revista de la Sociedad Real de Estadística, Serie B . 26 (2): 211–252. JSTOR 2984418 . Señor 0192611 .
- Carroll, RJ; Ruppert, D. (1981). "Sobre la predicción y la familia de la transformación del poder" (PDF) . Biometrika . 68 (3): 609–615. doi : 10.1093 / biomet / 68.3.609 .
- DeGroot, MH (1987). "Una conversación con George Box" . Ciencia estadística . 2 (3): 239-258. doi : 10.1214 / ss / 1177013223 .
- Handelsman, DJ (2002). "Transformaciones de potencia óptimas para el análisis de la concentración de espermatozoides y otras variables del semen". Revista de Andrología . 23 (5).
- Gluzman, S .; Yukalov, VI (2006). "El poder auto-similar se transforma en problemas de extrapolación". Revista de Química Matemática . 39 (1): 47–56. arXiv : cond-mat / 0606104 . Código bibliográfico : 2006cond.mat..6104G . doi : 10.1007 / s10910-005-9003-7 .
- Howarth, RJ; Earle, SAM (1979). "Aplicación de una transformación energética generalizada a datos geoquímicos". Revista de la Asociación Internacional de Geología Matemática . 11 (1): 45–62. doi : 10.1007 / BF01043245 .
enlaces externos
- Nishii, R. (2001) [1994], "Transformación de Box-Cox" , Encyclopedia of Mathematics , EMS Press( enlace fijo )
- Sanford Weisberg, Yeo-Johnson Power Transformations