Corrección de Sheppard


En estadística, las correcciones de Sheppard son correcciones aproximadas a las estimaciones de los momentos calculados a partir de datos agrupados . El concepto lleva el nombre de William Fleetwood Sheppard .

Sea el momento k -ésimo medido , el momento corregido correspondiente y el intervalo de clase (ancho del contenedor). No es necesaria corrección para la media (primer momento sobre cero). Los primeros momentos medidos y corregidos con respecto a la media se relacionan de la siguiente manera:

Cuando los datos provienen de una población normalmente distribuida, la agrupación en intervalos y el uso del punto medio del intervalo como el valor observado da como resultado una sobreestimación de la varianza. Por eso la corrección de la varianza es negativa. La razón por la que la estimación no corregida de la varianza es una sobreestimación es que el error está negativamente correlacionado con la observación. Para la distribución uniforme, el error no está correlacionado con la observación, por lo que la corrección debe ser + c 2/12 , que es la varianza del error mismo en lugar de − c 2/12 . Por tanto, la corrección de Sheppard está sesgada a favor de las distribuciones de población en las que el error está negativamente correlacionado con la observación.

Los cumulantes de la suma de la variable agrupada y la variable uniforme son las sumas de los cumulantes. Como cumulantes impares de una distribución uniforme son cero; sólo los momentos pares se ven afectados.

Los cumulantes segundo y cuarto de la distribución uniforme en (−0.5 c , 0.5 c ) son, respectivamente, c 2/12 y − c 4/120 .