En teoría de probabilidad y estadística , la distribución chi-cuadrado generalizada (o distribución chi-cuadrado generalizada ) es la distribución de una forma cuadrática de una variable multinormal (vector normal) , o una combinación lineal de diferentes variables normales y cuadrados de variables normales. De manera equivalente, también es una suma lineal de variables chi-cuadrado independientes no centrales y una variable normal . Hay varias otras generalizaciones similares para las que a veces se usa el mismo término; algunos de ellos son casos especiales de la familia aquí discutida, por ejemplo, la distribución gamma .
Función de densidad de probabilidad | |||
Función de distribución acumulativa | |||
Notación | |||
---|---|---|---|
Parámetros | , vector de pesos de componentes chi-cuadrado no central , vector de grados de libertad de componentes chi-cuadrado no central , vector de parámetros de no centralidad de componentes chi-cuadrado , media de término normal , sd de término normal | ||
Apoyo | |||
Significar | |||
Diferencia | |||
CF |
Definición
La variable chi-cuadrado generalizada se puede describir de múltiples formas. Uno es escribirlo como una suma lineal de variables chi-cuadrado independientes no centrales y una variable normal: [1] [2]
Aquí los parámetros son los pesos. , los grados de libertad y no centralidades de los chi-cuadrados constituyentes, y los parámetros normales y . Algunos casos especiales importantes de esto tienen todos los pesos. del mismo signo, o tienen componentes centrales de chi-cuadrado, u omiten el término normal.
Dado que una variable chi-cuadrado no central es una suma de cuadrados de variables normales con diferentes medias, la variable chi-cuadrado generalizada también se define como una suma de cuadrados de variables normales independientes, más una variable normal independiente: es decir, una cuadrática en variables normales.
Otra forma equivalente es formularlo como una forma cuadrática de un vector normal : [3] [4]
- .
Aquí es una matriz, es un vector, y es un escalar. Estos, junto con la media y matriz de covarianza del vector normal , parametrizar la distribución. Los parámetros de la primera expresión (en términos de chi-cuadrados no centrales, una normal y una constante) se pueden calcular en términos de los parámetros de la última expresión (forma cuadrática de un vector normal). [4] Si (y solo si)en esta formulación es positivo-definido , entonces todos los en la primera formulación tendrá el mismo signo.
Para el caso más general, se puede hacer una reducción hacia una forma estándar común utilizando una representación de la siguiente forma: [5]
donde D es una matriz diagonal y donde x representa un vector de variables aleatorias normales estándar no correlacionadas .
Calcular el pdf / cdf / cdf inverso / números aleatorios
Las funciones de densidad de probabilidad, distribución acumulativa y distribución acumulativa inversa de una variable chi-cuadrado generalizada no tienen expresiones simples de forma cerrada. Sin embargo, se han publicado algoritmos numéricos [5] [2] [6] [4] y código informático ( Fortran y C , Matlab , R ) para evaluar algunos de estos y generar muestras aleatorias.
Aplicaciones
El chi-cuadrado generalizado es la distribución de estimaciones estadísticas en los casos en que la teoría estadística habitual no se cumple, como en los ejemplos siguientes.
En ajuste y selección de modelos
Si un modelo predictivo se ajusta por mínimos cuadrados , pero los residuos tienen autocorrelación o heterocedasticidad , los modelos alternativos se pueden comparar (en la selección del modelo ) relacionando los cambios en la suma de cuadrados con una distribución chi-cuadrado generalizada asintóticamente válida . [3]
Clasificación de vectores normales mediante análisis discriminante gaussiano
Si es un vector normal, su probabilidad logarítmica es una forma cuadrática de, y por lo tanto se distribuye como un chi cuadrado generalizado. La razón logarítmica de verosimilitud quesurge de una distribución normal versus otra también es una forma cuadrática , por lo que se distribuye como un chi-cuadrado generalizado. [4]
En el análisis discriminante gaussiano, las muestras de distribuciones multinormales se separan de manera óptima mediante el uso de un clasificador cuadrático , un límite que es una función cuadrática (por ejemplo, la curva definida al establecer la razón de verosimilitud entre dos gaussianos en 1). Las tasas de error de clasificación de diferentes tipos (falsos positivos y falsos negativos) son integrales de las distribuciones normales dentro de las regiones cuadráticas definidas por este clasificador. Dado que esto es matemáticamente equivalente a integrar una forma cuadrática de un vector normal, el resultado es una integral de una variable chi cuadrado generalizada. [4]
En procesamiento de señales
La siguiente aplicación surge en el contexto del análisis de Fourier en el procesamiento de señales , la teoría de la renovación en la teoría de la probabilidad y los sistemas de múltiples antenas en la comunicación inalámbrica . El factor común de estas áreas es que la suma de las variables distribuidas exponencialmente es de importancia (o, de manera idéntica, la suma de las magnitudes cuadradas de las variables gaussianas complejas centradas de forma circular-simétrica ).
Si son k independiente , circularmente simétrica centrada gaussianas complejas variables aleatorias con media 0 y varianza , luego la variable aleatoria
tiene una distribución chi-cuadrado generalizada de una forma particular. La diferencia con la distribución estándar de chi-cuadrado es queson complejas y pueden tener diferentes varianzas, y la diferencia con la distribución chi-cuadrado más generalizada es que la matriz de escala A relevante es diagonal. Sipara todo yo , entonces, reducido por (es decir, multiplicado por ), tiene una distribución chi-cuadrado ,, también conocida como distribución Erlang . Sitener valores distintos para todo i , entoncestiene el pdf [7]
Si hay conjuntos de variaciones repetidas entre , suponga que se dividen en M conjuntos, cada uno de los cuales representa un cierto valor de varianza. Denotarpara ser el número de repeticiones en cada grupo. Es decir, el m ésimo conjunto contiene variables que tienen varianza Representa una combinación lineal arbitraria de independientes -variables aleatorias distribuidas con diferentes grados de libertad:
El pdf de es [8]
dónde
con del set de todas las particiones de (con ) definido como
Ver también
- Grados de libertad (estadísticas) #Alternativa
- Distribución chi-cuadrado no central
- Distribución chi-cuadrado
Referencias
- ^ Davies, RB (1973) Inversión numérica de una función característica. Biometrika , 60 (2), 415–417
- ^ a b Davies, R, B. (1980) "Algoritmo AS155: La distribución de una combinación lineal de χ 2 variables aleatorias", Estadística aplicada , 29, 323–333
- ^ a b Jones, DA (1983) "Análisis estadístico de modelos empíricos ajustados por optimización", Biometrika , 70 (1), 67-88
- ↑ a b c d e Das, Abhranil (2020). "Un método para integrar y clasificar distribuciones normales". arXiv : 2012.14331 .
- ^ a b Sheil, J., O'Muircheartaigh, I. (1977) "Algoritmo AS106: La distribución de formas cuadráticas no negativas en variables normales", Estadística aplicada , 26, 92-98
- ^ Imhof, JP (1961). "Calcular la distribución de formas cuadráticas en variables normales" (PDF) . Biometrika . 48 (3/4): 419–426. doi : 10.2307 / 2332763 . JSTOR 2332763 .
- ^ D. Hammarwall, M. Bengtsson, B. Ottersten (2008) "Adquirir CSI parcial para transmisión espacialmente selectiva por retroalimentación de norma de canal instantánea", Transacciones IEEE sobre procesamiento de señales , 56, 1188-1204
- ^ E. Björnson, D. Hammarwall, B. Ottersten (2009) "Explotación de la retroalimentación de la norma de canal cuantificada a través de estadísticas condicionales en sistemas MIMO correlacionados arbitrariamente" , Transacciones IEEE sobre procesamiento de señales , 57, 4027-4041
enlaces externos
- Davies, RB: código fuente de Fortran y C para "Combinación lineal de variables aleatorias chi-cuadrado"
- Das, A: código MATLAB para calcular las estadísticas, pdf, cdf, cdf inverso y números aleatorios de la distribución chi-cuadrado generalizada.