Estimador L

En estadística , un estimador L es un estimador que es una combinación lineal de estadísticas de orden de las mediciones (que también se denomina estadística L ). Esto puede ser tan pequeño como un solo punto, como en la mediana (de un número impar de valores), o tantos como todos los puntos, como en la media.

Los estimadores L simples se pueden estimar visualmente a partir de un diagrama de caja e incluyen rango intercuartílico , rango medio , rango , rango medio y trimano .

Los principales beneficios de los estimadores L son que a menudo son estadísticas extremadamente simples y, a menudo, robustas : asumiendo datos ordenados, son muy fáciles de calcular e interpretar y, a menudo, resistentes a valores atípicos. Por lo tanto, son útiles en estadísticas sólidas, como estadística descriptiva , en educación estadística y cuando el cálculo es difícil. Sin embargo, son ineficientes , y en los tiempos modernos se prefieren los estimadores M estadísticos robustos , aunque estos son mucho más difíciles computacionalmente. En muchas circunstancias, los estimadores L son razonablemente eficientes y, por lo tanto, adecuados para la estimación inicial.

Ejemplos de

Un ejemplo básico es la mediana . Dados n valores ${\ Displaystyle x_ {1}, \ ldots, x_ {n}}$ , Si ${\ Displaystyle n = 2k + 1}$ es impar, la mediana es igual a ${\ Displaystyle x _ {(k + 1)}}$ , la ${\ Displaystyle (n + 1) / 2}$ estadística de -o orden; Si ${\ Displaystyle n = 2k}$ es par, es el promedio de las estadísticas de dos órdenes: ${\ Displaystyle (x _ {(k)} + x _ {(k + 1)}) / 2}$ . Ambas son combinaciones lineales de estadísticas de orden y, por lo tanto, la mediana es un ejemplo simple de estimador L.

Una lista más detallada de ejemplos incluye: con un solo punto, el máximo, el mínimo o cualquier estadístico o cuantil de un solo orden ; con uno o dos puntos, la mediana; con dos puntos, el rango medio , el rango , el resumen medio ( rango medio recortado , incluido el rango medio ) y el rango recortado (incluido el rango intercuartílico y el rango interdecil ); con tres puntas, el trimeo ; con una fracción fija de los puntos, la media recortada (incluida la media intercuartil ) y la media Winsorizada ; con todos los puntos, la media.

Tenga en cuenta que algunos de estos (como la mediana o el rango medio) son medidas de tendencia central y se utilizan como estimadores para un parámetro de ubicación , como la media de una distribución normal, mientras que otros (como el rango o el rango recortado) son medidas de dispersión estadística y se utilizan como estimadores de un parámetro de escala , como la desviación estándar de una distribución normal.

Los estimadores L también pueden medir la forma de una distribución, más allá de la ubicación y la escala. Por ejemplo, la bisagra media menos la mediana es un estimador L de 3 términos que mide la asimetría , y otras diferencias de los sumarios medios dan medidas de asimetría en diferentes puntos de la cola. ^[1]

Los momentos L de muestra son estimadores L para el momento L de la población y tienen expresiones bastante complejas. Los momentos L generalmente se tratan por separado; consulte ese artículo para obtener más detalles.

Robustez

Los estimadores L suelen ser estadísticamente resistentes y tienen un alto punto de ruptura . Esto se define como la fracción de las mediciones que pueden cambiarse arbitrariamente sin que la estimación resultante tienda al infinito (es decir, se "descomponga"). El punto de ruptura de un estimador L viene dado por el estadístico de orden más cercano al mínimo o al máximo: por ejemplo, la mediana tiene un punto de ruptura del 50% (el más alto posible) y una media de n % recortada o Winsorizada tiene una ruptura punto de n %.

No todos los estimadores L son robustos; si incluye el mínimo o el máximo, entonces tiene un punto de ruptura de 0. Estos estimadores L no robustos incluyen el rango mínimo, máximo, medio y medio. Sin embargo, los equivalentes recortados son robustos.

Los estimadores L robustos que se utilizan para medir la dispersión, como el IQR, proporcionan medidas de escala sólidas .

Aplicaciones

En el uso práctico en estadísticas robustas , los estimadores L han sido reemplazados por estimadores M , que proporcionan estadísticas robustas que también tienen una alta eficiencia relativa , a costa de ser mucho más complejos y opacos computacionalmente.

Sin embargo, la simplicidad de los estimadores L significa que se pueden interpretar y visualizar fácilmente, y los hace adecuados para la estadística descriptiva y la educación estadística ; muchos incluso pueden calcularse mentalmente a partir de un resumen de cinco números o un resumen de siete números , o visualizarse a partir de un diagrama de caja . Los estimadores L juegan un papel fundamental en muchos enfoques de la estadística no paramétrica .

Aunque no paramétrico, L-estimadores se utilizan con frecuencia para la estimación de parámetros , como se indica por el nombre, aunque a menudo se deben ajustar para producir un imparcial estimador consistente . La elección del estimador L y el ajuste dependen de la distribución cuyo parámetro se esté estimando.

Por ejemplo, al estimar un parámetro de ubicación , para una distribución simétrica, un estimador L simétrico (como la mediana o la mitad) será insesgado. Sin embargo, si la distribución tiene sesgo , los estimadores L simétricos generalmente estarán sesgados y requerirán ajustes. Por ejemplo, en una distribución sesgada, la asimetría no paramétrica (y los coeficientes de asimetría de Pearson ) miden el sesgo de la mediana como estimador de la media.

Al estimar un parámetro de escala , como cuando se usa un estimador L como una medida robusta de escala , como para estimar la varianza o la desviación estándar de la población , generalmente se debe multiplicar por un factor de escala para convertirlo en un estimador consistente insesgado; ver parámetro de escala: estimación .

Por ejemplo, dividiendo el IQR por ${\ Displaystyle 2 {\ sqrt {2}} \ operatorname {erf} ^ {- 1} (1/2) \ approx 1.349}$ (usando la función de error ) lo convierte en un estimador consistente e insesgado para la varianza de la población si los datos siguen una distribución normal .

Los estimadores L también se pueden utilizar como estadísticas por derecho propio; por ejemplo, la mediana es una medida de ubicación y el IQR es una medida de dispersión. En estos casos, las estadísticas de la muestra pueden actuar como estimadores de su propio valor esperado ; por ejemplo, la mediana de la muestra es un estimador de la mediana de la población.

Ventajas

Más allá de la simplicidad, los estimadores L también suelen ser robustos y fáciles de calcular.

Suponiendo datos ordenados, los estimadores L que involucran solo unos pocos puntos pueden calcularse con muchas menos operaciones matemáticas que estimaciones eficientes. ^[2]^[3] Antes de la llegada de las calculadoras electrónicas y las computadoras , estas proporcionaban una forma útil de extraer gran parte de la información de una muestra con un trabajo mínimo. Estos permanecieron en el uso práctico a través del siglo temprano y mediados 20, cuando automatizados de clasificación de tarjetas perforadas de datos fue posible, pero siguió siendo difícil cálculo, ^[2] y sigue siendo de uso hoy en día, para las estimaciones dadas una lista de valores numéricos en no- máquina -forma legible , donde la entrada de datos es más costosa que la clasificación manual. También permiten una estimación rápida.

Los estimadores L son a menudo mucho más robustos que los métodos convencionales de máxima eficiencia: la mediana es estadísticamente resistente al máximo , tiene un punto de ruptura del 50% , y el rango medio recortado del X% tiene un punto de ruptura del X%, mientras que la media muestral (que es máximamente eficiente) es mínimamente robusto, desglosándose por un solo valor atípico.

Eficiencia

Si bien los estimadores L no son tan eficientes como otras estadísticas, a menudo tienen una eficiencia relativa razonablemente alta y muestran que una gran fracción de la información utilizada en la estimación se puede obtener utilizando solo unos pocos puntos, tan solo uno, dos o tres. . Alternativamente, muestran que las estadísticas de pedidos contienen una cantidad significativa de información.

Por ejemplo, en términos de eficiencia, dada una muestra de un parámetro numérico distribuido normalmente , la media aritmética (promedio) de la población se puede estimar con la máxima eficiencia calculando la media de la muestra , sumando todos los miembros de la muestra y dividiendo por el número de miembros.

Sin embargo, para un gran conjunto de datos (más de 100 puntos) de una población simétrica, la media se puede estimar de manera razonablemente eficiente en relación con la mejor estimación mediante L-estimadores. Usando un solo punto, esto se hace tomando la mediana de la muestra, sin que se requieran cálculos (aparte de la clasificación); esto produce una eficiencia del 64% o mejor (para todos los n ). Usando dos puntos, una estimación simple es el rango medio (el rango medio recortado en un 25% ), pero una estimación más eficiente es el rango medio recortado en un 29%, es decir, promediando los dos valores al 29% del camino desde el más pequeño. y los valores más grandes: los percentiles 29 y 71; esto tiene una eficiencia de aproximadamente el 81%. ^[3] Para tres puntos, se puede usar el trimeo (promedio de la mediana y la mitad de la bisagra), aunque el promedio de los percentiles 20, 50 y 80 arroja una eficiencia del 88%. El uso de puntos adicionales produce una mayor eficiencia, aunque es notable que solo se necesitan 3 puntos para una eficiencia muy alta.

Para estimar la desviación estándar de una distribución normal, el rango interdecil escalado proporciona un estimador razonablemente eficiente, aunque en su lugar se toma el rango recortado al 7% (la diferencia entre los percentiles 7 y 93) y se divide por 3 (correspondiente al 86% de los datos). de una distribución normal dentro de 1,5 desviaciones estándar de la media) arroja una estimación de aproximadamente 65% de eficiencia. ^[3]

Para muestras pequeñas, los estimadores L también son relativamente eficientes: el resumen medio del tercer punto de cada extremo tiene una eficiencia de alrededor del 84% para muestras de tamaño aproximadamente 10, y el rango dividido por ${\ Displaystyle {\ sqrt {n}}}$ tiene una eficiencia razonablemente buena para tamaños de hasta 20, aunque disminuye al aumentar n y el factor de escala se puede mejorar (eficiencia 85% para 10 puntos). Otros estimadores heurísticos para muestras pequeñas incluyen el rango sobre n (para el error estándar) y el rango al cuadrado sobre la mediana (para el chi-cuadrado de una distribución de Poisson). ^[3]

Ver también

Momento L
Estimador M

Referencias

^ Velleman y Hoaglin 1981 .
↑ a b Mosteller, 2006 .
^ a b c d Evans 1955 , Apéndice G: Estadísticas ineficientes, págs. 902–904 .

Evans, Robley Dunglison (1955). El núcleo atómico . Serie internacional de física pura y aplicada. McGraw-Hill. págs. 972 . ISBN 0-89874414-8.
Fraiman, R .; Meloche, J .; García-Escudero, LA; Gordaliza, A .; Él, X .; Maronna, R .; Yohai, VCJ; Sheather, SJ; McKean, JW; Pequeño, CG; Wood, A .; Fraiman, R .; Meloche, J. (1999). "Estimación L multivariante". Prueba . 8 (2): 255–317. doi : 10.1007 / BF02595872 .
Huber, Peter J. (2004). Estadísticas sólidas . Nueva York: Wiley-Interscience. ISBN 0-471-65072-2.
Mosteller, Frederick (2006) [1946]. "Sobre algunas estadísticas" ineficientes "útiles". En Fienberg, Stephen; Hoaglin, David (eds.). Artículos seleccionados de Frederick Mosteller . Springer Series en Estadística. Nueva York: Springer. págs. 69 –100. doi : 10.1007 / 978-0-387-44956-2_4 . ISBN 978-0-387-20271-6.
Shao, junio (2003). Estadística matemática . Berlín: Springer-Verlag. ISBN 0-387-95382-5.- sec. 5.2.2
Velleman, PF; Hoaglin, DC (1981). Aplicaciones, conceptos básicos y computación del análisis de datos exploratorios . ISBN 0-87150-409-X.

[FOOTNOTEVellemanHoaglin1981-1] Velleman y Hoaglin 1981 .

[FOOTNOTEMosteller2006-2] Mosteller, 2006 .

[FOOTNOTEEvans1955Appendix_G:_Inefficient_statistics,_pp._[httpsarchiveorgstreamatomicnucleus032805mbppagen925mode2up_902–904]-3] Evans 1955 , Apéndice G: Estadísticas ineficientes, págs. 902–904 .

[1]