En estadística , un estimador recortado es un estimador derivado de otro estimador al excluir algunos de los valores extremos , un proceso llamado truncamiento . Esto generalmente se hace para obtener una estadística más robusta y los valores extremos se consideran valores atípicos . Los estimadores recortados también suelen tener una mayor eficiencia para distribuciones de mezcla y distribuciones de cola pesada que el estimador no recortado correspondiente, a costa de una menor eficiencia para otras distribuciones, como la distribución normal .
Dado un estimador, la versión n % recortada se obtiene descartando el n % de las observaciones más bajas y más altas: es una estadística en el medio de los datos. Por ejemplo, la media recortada del 5% se obtiene tomando la media del rango del 5% al 95%. En algunos casos, un estimador recortado descarta un número fijo de puntos (como máximo y mínimo) en lugar de un porcentaje.
Ejemplos de
La mediana es la estadística más recortada (nominalmente 50%), ya que descarta todos los datos excepto los más centrales, y es igual a la media totalmente recortada o, de hecho, al rango medio totalmente recortado, o (para conjuntos de datos de tamaño impar) el totalmente recortado máximo o mínimo. Del mismo modo, ningún grado de recorte tiene ningún efecto sobre la mediana (una mediana recortada es la mediana) porque el recorte siempre excluye un número igual de los valores más bajos y más altos.
Los cuantiles se pueden considerar como máximos o mínimos recortados: por ejemplo, el percentil 5 es el mínimo recortado del 5%.
Los estimadores recortados que se utilizan para estimar un parámetro de ubicación incluyen:
- Media recortada
- Media modificada , descartando los valores mínimo y máximo
- Media intercuartil , la media recortada al 25%
- Midhinge , el rango medio recortado al 25%
Los estimadores recortados que se utilizan para estimar un parámetro de escala incluyen:
- Rango intercuartílico , el rango recortado al 25%
- Rango interdecil , el rango recortado al 10%
Estimadores recortadas que involucran sólo combinaciones lineales de puntos son ejemplos de L-estimadores .
Aplicaciones
Estimacion
Muy a menudo, los estimadores recortados se utilizan para la estimación de parámetros del mismo parámetro que el estimador no recortado . En algunos casos, el estimador puede utilizarse directamente, mientras que en otros casos se debe ajustar para producir un imparcial estimador consistente .
Por ejemplo, al estimar un parámetro de ubicación para una distribución simétrica, un estimador recortado será insesgado (asumiendo que el estimador original fue insesgado), ya que elimina la misma cantidad arriba y abajo. Sin embargo, si la distribución tiene un sesgo , los estimadores recortados generalmente estarán sesgados y requerirán ajustes. Por ejemplo, en una distribución sesgada, la asimetría no paramétrica (y los coeficientes de asimetría de Pearson ) miden el sesgo de la mediana como estimador de la media.
Al estimar un parámetro de escala , utilizando un estimador recortado como una medida robusta de escala , como para estimar la varianza o la desviación estándar de la población , generalmente se debe multiplicar por un factor de escala para convertirlo en un estimador consistente insesgado; ver parámetro de escala: estimación .
Por ejemplo, dividiendo el IQR por (usando la función de error ) lo convierte en un estimador insesgado y consistente para la desviación estándar de la población si los datos siguen una distribución normal .
Otros usos
Los estimadores recortados también se pueden usar como estadísticas por derecho propio; por ejemplo, la mediana es una medida de ubicación y el IQR es una medida de dispersión. En estos casos, las estadísticas de la muestra pueden actuar como estimadores de su propio valor esperado . Por ejemplo, la MAD de una muestra de una distribución estándar de Cauchy es un estimador de la MAD de la población, que en este caso es 1, mientras que la varianza de la población no existe.
Ver también
- Winsorising , una técnica relacionada
- Inflación subyacente , una estadística económica que omite componentes volátiles