Mejor predicción lineal insesgada


En estadística , la mejor predicción lineal insesgada ( BLUP ) se utiliza en modelos lineales mixtos para la estimación de efectos aleatorios . El BLUP fue derivado por Charles Roy Henderson en 1950, pero el término "mejor predictor lineal insesgado" (o "predicción") parece no haberse utilizado hasta 1962. [1] Las "Mejores predicciones lineales insesgadas" (BLUP) de efectos aleatorios son similares a las mejores estimaciones lineales insesgadas (AZULES) (consulte el teorema de Gauss-Markov ) de efectos fijos. La distinción surge porque es convencional hablar no de estimar efectos fijos sino de predecirefectos aleatorios, pero los dos términos son equivalentes. (Esto es un poco extraño, ya que los efectos aleatorios ya se han "realizado"; ya existen. El uso del término "predicción" puede deberse a que en el campo de la cría de animales en el que trabajaba Henderson, los efectos aleatorios eran generalmente méritos genéticos , que podría usarse para predecir la calidad de la descendencia (Robinson [1] página 28)). Sin embargo, las ecuaciones para los efectos "fijos" y para los efectos aleatorios son diferentes.

En la práctica, a menudo ocurre que los parámetros asociados con los términos de efecto aleatorio son desconocidos; estos parámetros son las variaciones de los efectos aleatorios y los residuos. Por lo general, los parámetros se estiman y se conectan al predictor, lo que conduce al mejor predictor lineal imparcial empírico (EBLUP). Observe que simplemente conectando el parámetro estimado en el predictor, no se tiene en cuenta la variabilidad adicional, lo que lleva a variaciones de predicción demasiado optimistas para el EBLUP. [ cita requerida ]

Las mejores predicciones lineales insesgadas son similares a las estimaciones empíricas de Bayes de efectos aleatorios en modelos lineales mixtos, excepto que en el último caso, donde las ponderaciones dependen de valores desconocidos de los componentes de la varianza, estas varianzas desconocidas se reemplazan por estimaciones basadas en muestras.

donde ξ j y ε j representan el efecto aleatorio y el error de observación para la observación j , y supongamos que no están correlacionados y tienen varianzas conocidas σ ξ 2 y σ ε 2 , respectivamente. Además, x j es un vector de variables independientes para la j- ésima observación y β es un vector de parámetros de regresión. El problema BLUP de proporcionar una estimación del valor libre de errores de observación para la k- ésima observación,

A diferencia del caso de la mejor estimación lineal insesgada , la "cantidad a estimar", no solo tiene una contribución de un elemento aleatorio, sino que una de las cantidades observadas, específicamente la que contribuye a , también tiene una contribución de este mismo elemento aleatorio. .

Henderson exploró la reproducción desde un punto de vista estadístico. Su trabajo ayudó al desarrollo del índice de selección (SI) y el valor reproductivo estimado (EBV). Estos métodos estadísticos influyeron en las clasificaciones de sementales de IA de inseminación artificial utilizadas en los Estados Unidos. Estos primeros métodos estadísticos se confunden con el BLUP ahora común en la cría de ganado.