En matemáticas , una variedad estadística es una variedad de Riemann , cada uno de cuyos puntos es una distribución de probabilidad . Las variedades estadísticas proporcionan un escenario para el campo de la geometría de la información . La métrica de información de Fisher proporciona una métrica sobre estos colectores. Siguiendo esta definición, la función logarítmica de verosimilitud es un mapa diferenciable y la puntuación es una inclusión . [1]
Ejemplos de
La familia de todas las distribuciones normales se puede considerar como un espacio paramétrico bidimensional parametrizado por el valor esperado μ y la varianza σ 2 ≥ 0. Equipado con la métrica de Riemann dada por la matriz de información de Fisher , es una variedad estadística con un geometría modelada en el espacio hiperbólico .
Un ejemplo simple de una variedad estadística, tomado de la física, sería el conjunto canónico : es una variedad unidimensional, con la temperatura T que sirve como coordenada en la variedad. Para cualquier temperatura fija T , uno tiene un espacio de probabilidad: entonces, para un gas de átomos, sería la distribución de probabilidad de las velocidades de los átomos. A medida que se varía la temperatura T , la distribución de probabilidad varía.
Otro ejemplo sencillo, tomado de la medicina, sería la distribución de probabilidad de los resultados de los pacientes, en respuesta a la cantidad de medicina administrada. Es decir, para una dosis fija, algunos pacientes mejoran y otros no: este es el espacio de probabilidad base. Si se varía la dosis, la probabilidad de resultados cambia. Por lo tanto, la dosificación es la coordenada en el colector. Para ser una variedad suave , uno tendría que medir los resultados en respuesta a cambios arbitrariamente pequeños en la dosis; este no es un ejemplo prácticamente realizable, a menos que se tenga un modelo matemático preexistente de dosis-respuesta en el que la dosis pueda variarse arbitrariamente.
Definición
Sea X una variedad orientable , y seaser una medida en X . Equivalentemente, dejemosser un espacio de probabilidad en, con álgebra sigma y probabilidad .
La variedad estadística S ( X ) de X se define como el espacio de todas las medidasen X (con sigma-álgebramantenido fijo). Tenga en cuenta que este espacio es de dimensión infinita; comúnmente se toma como un espacio Fréchet . Los puntos de S ( X ) son medidas.
En lugar de tratar con un espacio de dimensión infinita S ( X ), es común trabajar con una subvariedad de dimensión finita , definida al considerar un conjunto de distribuciones de probabilidad parametrizadas por algún parámetro uniforme que varía continuamente.. Es decir, se consideran solo aquellas medidas que son seleccionadas por el parámetro. Si el parámetroes n- dimensional, entonces, en general, la subvariedad también lo será. Todas las variedades estadísticas de dimensión finita pueden entenderse de esta manera. [ aclaración necesaria ]
Referencias
- ^ Murray, Michael K .; Rice, John W. (1993). "La definición de una variedad estadística" . Geometría diferencial y estadística . Chapman y Hall. págs. 76–77. ISBN 0-412-39860-5.