Estadística U

En teoría estadística , una estadística U es una clase de estadística que es especialmente importante en la teoría de la estimación ; la letra "U" significa imparcial. En estadística elemental, las estadísticas U surgen naturalmente al producir estimadores insesgados de mínima varianza .

La teoría de la estadística U permite derivar un estimador insesgado de varianza mínima a partir de cada estimador insesgado de un parámetro estimable (alternativamente, estadístico funcional ) para grandes clases de distribuciones de probabilidad. ^[1]^[2] Un parámetro estimable es una función medible de la distribución de probabilidad acumulada de la población : por ejemplo, para cada distribución de probabilidad, la mediana de la población es un parámetro estimable. La teoría de la estadística U se aplica a clases generales de distribuciones de probabilidad.

Muchas estadísticas derivadas originalmente para familias paramétricas particulares se han reconocido como estadísticas U para distribuciones generales. En estadística no paramétrica , la teoría de la estadística U se utiliza para establecer procedimientos estadísticos (como estimadores y pruebas) y estimadores relacionados con la normalidad asintótica y la varianza (en muestras finitas) de tales cantidades. ^[3] La teoría se ha utilizado para estudiar estadísticas más generales, así como procesos estocásticos , como gráficos aleatorios . ^[4]^[5]^[6]

Suponga que un problema involucra variables aleatorias independientes e idénticamente distribuidas y que se requiere la estimación de un determinado parámetro. Suponga que se puede construir una estimación insesgada simple basada en solo unas pocas observaciones: esto define el estimador básico basado en un número dado de observaciones. Por ejemplo, una sola observación es en sí misma una estimación insesgada de la media y se pueden utilizar un par de observaciones para obtener una estimación insesgada de la varianza. El estadístico U basado en este estimador se define como el promedio (en todas las selecciones combinatorias del tamaño dado del conjunto completo de observaciones) del estimador básico aplicado a las submuestras.

Sen (1992) proporciona una revisión del artículo de Wassily Hoeffding (1948), que introdujo las estadísticas U y estableció la teoría relacionada con ellas, y al hacerlo, Sen describe la importancia que tienen las estadísticas U en la teoría estadística. Sen dice ^[7] "El impacto de Hoeffding (1948) es abrumador en la actualidad y es muy probable que continúe en los años venideros". Tenga en cuenta que la teoría de la estadística U no se limita a ^[8] el caso de variables aleatorias independientes e idénticamente distribuidas o de variables aleatorias escalares. ^[9]

Definición

El término estadístico U, debido a Hoeffding (1948), se define de la siguiente manera.

Dejar ${\ Displaystyle f \ colon R ^ {r} \ to R}$ ser una función de valor real o de valor complejo de ${\ Displaystyle r}$ variables. Para cada ${\ Displaystyle n \ geq r}$ el estadístico U asociado ${\ Displaystyle f_ {n} \ dos puntos R ^ {n} \ a R}$ es igual al promedio sobre muestras ordenadas ${\ Displaystyle (\ varphi (1), \ ldots, \ varphi (r))}$ de tamaño ${\ Displaystyle r}$ de los valores de la muestra ${\ Displaystyle f (x _ {\ varphi})}$ . En otras palabras,

${\ Displaystyle f_ {n} (x_ {1}, \ ldots, x_ {n}) = {\ frac {1} {\ binom {n} {r}}} \ sum _ {t = 1} ^ {\ binom {n} {r}} f (x _ {\ varphi ^ {t} (1)}, \ ldots, x _ {\ varphi ^ {t} (r)})}$ ,

dónde ${\ Displaystyle \ varphi ^ {t}: = (\ varphi ^ {t} (1), \ dots, \ varphi ^ {t} (r))}$ denota el ${\ Displaystyle t ^ {\ rm {th}}}$ de ${\ Displaystyle n}$ -escoger- ${\ Displaystyle r}$ distintas muestras ordenadas de tamaño ${\ Displaystyle r}$ tomado de ${\ Displaystyle \ {1, \ ldots, n \}}$ . Cada estadístico U ${\ Displaystyle f_ {n} (x_ {1}, \ ldots, x_ {n})}$ es necesariamente una función simétrica .

Las estadísticas U son muy naturales en el trabajo estadístico, particularmente en el contexto de Hoeffding de variables aleatorias independientes e idénticamente distribuidas , o más generalmente para secuencias intercambiables , como en el muestreo aleatorio simple de una población finita, donde la propiedad definitoria se denomina 'herencia en la media'.

Las estadísticas k de Fisher y las polikayas de Tukey son ejemplos de estadísticas U polinomiales homogéneas (Fisher, 1929; Tukey, 1950). Para una muestra aleatoria simple φ de tamaño n tomada de una población de tamaño N , el estadístico U tiene la propiedad de que el promedio sobre los valores muestrales ƒ _n ( xφ ) es exactamente igual al valor de la población ƒ _N ( x ).

Ejemplos de

Algunos ejemplos: Si ${\ Displaystyle f (x) = x}$ la estadística U ${\ Displaystyle f_ {n} (x) = {\ bar {x}} _ {n} = (x_ {1} + \ cdots + x_ {n}) / n}$ es la media muestral.

Si ${\ Displaystyle f (x_ {1}, x_ {2}) = | x_ {1} -x_ {2} |}$ , el estadístico U es la desviación media por pares ${\ Displaystyle f_ {n} (x_ {1}, \ ldots, x_ {n}) = 2 / (n (n-1)) \ sum _ {i> j} | x_ {i} -x_ {j} |}$ , definido para ${\ Displaystyle n \ geq 2}$ .

Si ${\ Displaystyle f (x_ {1}, x_ {2}) = (x_ {1} -x_ {2}) ^ {2} / 2}$ , el estadístico U es la varianza muestral ${\ Displaystyle f_ {n} (x) = \ sum (x_ {i} - {\ bar {x}} _ {n}) ^ {2} / (n-1)}$ con divisor ${\ Displaystyle n-1}$ , definido para ${\ Displaystyle n \ geq 2}$ .

El tercero ${\ Displaystyle k}$ -estadística ${\ Displaystyle k_ {3, n} (x) = \ sum (x_ {i} - {\ bar {x}} _ {n}) ^ {3} n / ((n-1) (n-2) )}$ , la asimetría muestral definida para ${\ Displaystyle n \ geq 3}$ , es una estadística U

El siguiente caso destaca un punto importante. Si ${\ Displaystyle f (x_ {1}, x_ {2}, x_ {3})}$ es la mediana de tres valores, ${\ Displaystyle f_ {n} (x_ {1}, \ ldots, x_ {n})}$ no es la mediana de ${\ Displaystyle n}$ valores. Sin embargo, es una estimación insesgada de varianza mínima del valor esperado de la mediana de tres valores, no la mediana de la población. Estimaciones similares juegan un papel central en el que los parámetros de una familia de distribuciones de probabilidad se estiman por momentos de probabilidad ponderada o L-momentos .

Ver también

Estadística V

Notas

^ Cox y Hinkley (1974), p. 200, pág. 258
^ Hoeffding (1948), entre las ecuaciones (4.3), (4.4)
↑ Sen (1992)
^ Página 508 en Koroljuk, VS; Borovskich, Yu. V. (1994). Teoría de las U- estadísticas . Matemáticas y sus aplicaciones. 273 (Traducido por PV Malyshev y DV Malyshev de la edición original rusa de 1989). Dordrecht: Grupo de editores académicos de Kluwer. págs. x + 552. ISBN 0-7923-2608-3. Señor 1472486 .
^ Páginas 381–382 en Borovskikh, Yu. V. (1996).Estadísticas U en espacios de Banach . Utrecht: VSP. págs. xii + 420. ISBN 90-6764-200-2. Señor 1419498 .
^ Página xii en Kwapień, Stanisƚaw; Woyczyński, Wojbor A. (1992). Series aleatorias e integrales estocásticas: Única y múltiple . Probabilidad y sus aplicaciones. Boston, MA: Birkhäuser Boston, Inc. págs. Xvi + 360. ISBN 0-8176-3572-6. Señor 1167198 .
^ Sen (1992) p. 307
↑ Sen (1992), p306
↑ El último capítulo de Borovskikh analiza las estadísticas U para elementos aleatorios intercambiables que toman valores en un espacio vectorial ( espacio de Banach separable ).

Referencias

Borovskikh, Yu. V. (1996).Estadísticas U en espacios de Banach . Utrecht: VSP. págs. xii + 420. ISBN 90-6764-200-2. Señor 1419498 .
Cox, DR, Hinkley, DV (1974) Estadísticas teóricas . Chapman y Hall. ISBN 0-412-12420-3
Fisher, RA (1929) Momentos y momentos producto de distribuciones muestrales. Actas de la London Mathematical Society , 2, 30: 199-238.
Hoeffding, W. (1948) Una clase de estadística con distribuciones asintóticamente normales. Annals of Statistics , 19: 293–325. (Reimpreso parcialmente en: Kotz, S., Johnson, NL (1992) Breakthroughs in Statistics , Vol I, págs. 308–334. Springer-Verlag. ISBN 0-387-94037-5 )
Koroljuk, VS; Borovskich, Yu. V. (1994). Teoría de las U- estadísticas . Matemáticas y sus aplicaciones. 273 (Traducido por PV Malyshev y DV Malyshev de la edición original rusa de 1989). Dordrecht: Grupo de editores académicos de Kluwer. págs. x + 552. ISBN 0-7923-2608-3. Señor 1472486 .
Lee, AJ (1990) U-Estadística: teoría y práctica . Marcel Dekker, Nueva York. pp320 ISBN 0-8247-8253-4
Sen, PK (1992) Introducción a Hoeffding (1948) Una clase de estadística con distribución asintóticamente normal. En: Kotz, S., Johnson, NL Breakthroughs in Statistics , Vol I, págs. 299-307. Springer-Verlag. ISBN 0-387-94037-5 .
Serfling, Robert J. (1980). Teoremas de aproximación de la estadística matemática . Nueva York: John Wiley and Sons. ISBN 0-471-02403-1.
Tukey, JW (1950). "Un poco de muestreo simplificado". Revista de la Asociación Estadounidense de Estadística . 45 (252): 501–519. doi : 10.1080 / 01621459.1950.10501142 .
Halmos, P. (1946). "La teoría de la estimación imparcial" . Anales de estadística matemática . 1 (17): 34–43. doi : 10.1214 / aoms / 1177731020 .

[1] Cox y Hinkley (1974), p. 200, pág. 258

[2] Hoeffding (1948), entre las ecuaciones (4.3), (4.4)

[3] Sen (1992)

[4] Página 508 en Koroljuk, VS; Borovskich, Yu. V. (1994). Teoría de las U- estadísticas . Matemáticas y sus aplicaciones. 273 (Traducido por PV Malyshev y DV Malyshev de la edición original rusa de 1989). Dordrecht: Grupo de editores académicos de Kluwer. págs. x + 552. ISBN 0-7923-2608-3. Señor 1472486 .

[5] Páginas 381–382 en Borovskikh, Yu. V. (1996).Estadísticas U en espacios de Banach . Utrecht: VSP. págs. xii + 420. ISBN 90-6764-200-2. Señor 1419498 .

[6] Página xii en Kwapień, Stanisƚaw; Woyczyński, Wojbor A. (1992). Series aleatorias e integrales estocásticas: Única y múltiple . Probabilidad y sus aplicaciones. Boston, MA: Birkhäuser Boston, Inc. págs. Xvi + 360. ISBN 0-8176-3572-6. Señor 1167198 .

[7] Sen (1992) p. 307

[8] Sen (1992), p306

[9] El último capítulo de Borovskikh analiza las estadísticas U para elementos aleatorios intercambiables que toman valores en un espacio vectorial ( espacio de Banach separable ).

[1]