Las propiedades de torsión en términos generales están asociadas con las propiedades de las muestras que se identifican con estadísticas que son adecuadas para el intercambio.
Descripción
Comenzando con una muestra observado a partir de una variable aleatoria X que tiene una ley de distribución dada con un parámetro no establecido, un problema de inferencia paramétrica consiste en calcular los valores adecuados, llamémoslos estimaciones , de este parámetro precisamente sobre la base de la muestra. Una estimación es adecuada si reemplazarla con el parámetro desconocido no causa un daño importante en los próximos cálculos. En la inferencia algorítmica , la idoneidad de una estimación se lee en términos de compatibilidad con la muestra observada.
A su vez, la compatibilidad de parámetros es una medida de probabilidad que derivamos de la distribución de probabilidad de la variable aleatoria a la que se refiere el parámetro. De esta forma identificamos un parámetro aleatorio Θ compatible con una muestra observada. Dado un mecanismo de muestreo , el fundamento de esta operación radica en el uso de la ley de distribución de semillas Z para determinar tanto la ley de distribución X para el dado como la ley de distribución Θ dada una muestra X. Por tanto, podemos derivar la última distribución directamente de la primera si somos capaces de relacionar los dominios del espacio muestral con subconjuntos de soporte Θ . En términos más abstractos, hablamos de propiedades de torsión de muestras con propiedades de parámetros e identificamos las primeras con estadísticas adecuadas para este intercambio, lo que denota un buen comportamiento con los parámetros desconocidos. El objetivo operativo es escribir la expresión analítica de la función de distribución acumulativa , a la luz de los valores observados s de un estadístico S , en función de la ley de distribución S cuando el parámetro X es exactamente θ.
Método
Dado un mecanismo de muestreo para la variable aleatoria X , modelamos ser igual a . Centrándose en una estadística relevantepara el parámetro θ , la ecuación maestra dice
Cuando s es una estadística de buen comportamiento con el parámetro, estamos seguros de que existe una relación monótona para cadaentre sy θ. También se nos asegura que Θ, en función depara s dados , es una variable aleatoria ya que la ecuación maestra proporciona soluciones que son factibles e independientes de otros parámetros (ocultos). [1]
La dirección de la monotonía determina para cualquier una relación entre eventos del tipo o viceversa , dónde es calculado por la ecuación maestra con . En el caso de que s asume valores discretos, la primera relación cambia a dónde es el tamaño del grano de discretización s , ídem con la tendencia de monotonía opuesta. Reanudando estas relaciones en todas las semillas, para s continuas tenemos o
o
Para s discreto tenemos un intervalo donde mentiras, debido a . Todo el artificio lógico se llama argumento retorcido . Un procedimiento que lo implementa es el siguiente.
Algoritmo
Generando una ley de distribución de parámetros a través de un argumento retorcido |
---|
Dada una muestra de una variable aleatoria con parámetro parameter desconocido,
|
Observación
La lógica detrás de los argumentos retorcidos no cambia cuando los parámetros son vectores, aunque surgen algunas complicaciones del manejo de las desigualdades conjuntas. En cambio, la dificultad de tratar con un vector de parámetros resultó ser el talón de Aquiles del enfoque de Fisher para la distribución fiducial de parámetros ( Fisher 1935 ). Además, las probabilidades constructivas de Fraser ( Fraser 1966 ) diseñadas con el mismo propósito no tratan este punto por completo.
Ejemplo
Para extraído de una distribución gamma , cuya especificación requiere valores para los parámetros λ y k , se puede establecer un argumento de torsión siguiendo el procedimiento siguiente. Dado el significado de estos parámetros sabemos que
dónde y . Esto conduce a una función de distribución acumulativa conjunta
Usando la primera factorización y reemplazando con para tener una distribución de que es independiente de , tenemos
donde m denota el tamaño de la muestra, y son las estadísticas observadas (por lo tanto, con índices indicados con letras mayúsculas), la función gamma incompleta yla función H de Fox que se puede aproximar con una distribución gamma nuevamente con los parámetros adecuados (por ejemplo, estimados mediante el método de momentos ) como una función de k y m .
Con un tamaño de muestra y , puede encontrar el pdf conjunto de los parámetros Gamma K ya la izquierda. La distribución marginal de K se muestra en la imagen de la derecha.
Notas
- ^ De forma predeterminada, las letras mayúsculas (como U , X ) denotarán variables aleatorias y las letras minúsculas ( u , x ) sus realizaciones correspondientes.
Referencias
- Fisher, MA (1935). "El argumento fiducial en la inferencia estadística". Anales de la eugenesia . 6 (4): 391–398. doi : 10.1111 / j.1469-1809.1935.tb02120.x . hdl : 2440/15222 .
- Fraser, DAS (1966). "Probabilidad estructural y generalización". Biometrika . 53 (1/2): 1–9. doi : 10.2307 / 2334048 . JSTOR 2334048 .
- Apolloni, B; Malchiodi, D .; Gaito, S. (2006). Inferencia algorítmica en el aprendizaje automático . Serie internacional sobre inteligencia avanzada. 5 (2ª ed.). Adelaida: Magill.
Conocimiento avanzado internacional