En estadística , un modelo semiparamétrico es un modelo estadístico que tiene componentes paramétricos y no paramétricos .
Un modelo estadístico es una familia de distribuciones parametrizada :indexado por un parámetro .
- Un modelo paramétrico es un modelo en el que el parámetro de indexación es un vector en -espacio euclidiano dimensional , para algún entero no negativo. [1] Por lo tanto, es de dimensión finita, y .
- Con un modelo no paramétrico , el conjunto de posibles valores del parámetro es un subconjunto de un espacio , que no es necesariamente de dimensión finita. Por ejemplo, podríamos considerar el conjunto de todas las distribuciones con media 0. Dichos espacios son espacios vectoriales con estructura topológica , pero pueden no ser de dimensión finita como espacios vectoriales. Por lo tanto,para algún espacio posiblemente de dimensión infinita .
- Con un modelo semiparamétrico, el parámetro tiene un componente de dimensión finita y un componente de dimensión infinita (a menudo una función de valor real definida en la línea real). Por lo tanto,, dónde es un espacio de dimensión infinita.
Al principio, puede parecer que los modelos semiparamétricos incluyen modelos no paramétricos, ya que tienen un componente de dimensión infinita y también de dimensión finita. Sin embargo, un modelo semiparamétrico se considera "más pequeño" que un modelo completamente no paramétrico porque a menudo solo nos interesa el componente de dimensión finita de. Es decir, el componente de dimensión infinita se considera un parámetro molesto . [2] En los modelos no paramétricos, por el contrario, el interés principal es estimar el parámetro de dimensión infinita. Por tanto, la tarea de estimación es estadísticamente más difícil en modelos no paramétricos.
Ejemplo
Un ejemplo bien conocido de modelo semiparamétrico es el modelo de riesgos proporcionales de Cox . [3] Si nos interesa estudiar la hora ante un evento como la muerte por cáncer o el fallo de una bombilla, el modelo de Cox especifica la siguiente función de distribución para :
dónde es el vector covariable, y y son parámetros desconocidos. . Aquí es de dimensión finita y es de interés; es una función del tiempo no negativa desconocida (conocida como función de riesgo de referencia) y, a menudo, es un parámetro molesto . El conjunto de posibles candidatos para es de dimensión infinita.
Ver también
Notas
- ^ Bickel, PJ; Klaassen, CAJ; Ritov, Y .; Wellner, JA (2006), "Semiparametrics", en Kotz, S .; et al. (eds.), Enciclopedia de Ciencias Estadísticas , Wiley.
- ^ Oakes, D. (2006), "Modelos semiparamétricos", en Kotz, S .; et al. (eds.), Enciclopedia de Ciencias Estadísticas , Wiley.
- ^ Balakrishnan, N .; Rao, CR (2004). Manual de estadística 23: Avances en el análisis de supervivencia . Elsevier . pag. 126.
Referencias
- Bickel, PJ; Klaassen, CAJ; Ritov, Y .; Wellner, JA (1998), Estimación eficiente y adaptativa para modelos semiparamétricos , Springer
- Härdle, Wolfgang; Müller, Marlene; Sperlich, Stefan; Werwatz, Axel (2004), Modelos no paramétricos y semiparamétricos , Springer
- Kosorok, Michael R. (2008), Introducción a los procesos empíricos y la inferencia semiparamétrica , Springer
- Tsiatis, Anastasios A. (2006), Teoría semiparamétrica y datos faltantes , Springer
- Comenzado, Janet M .; Hall, WJ; Huang, Wei-Min; Wellner, Jon A. (1983), "Información y eficiencia asintótica en modelos paramétricos - no paramétricos", Annals of Statistics, 11 (1983), no. 2, 432--452