Modelo semiparamétrico

En estadística , un modelo semiparamétrico es un modelo estadístico que tiene componentes paramétricos y no paramétricos .

Un modelo estadístico es una familia de distribuciones parametrizada : ${\ Displaystyle \ {P _ {\ theta}: \ theta \ en \ Theta \}}$ indexado por un parámetro ${\ Displaystyle \ theta}$ .

Un modelo paramétrico es un modelo en el que el parámetro de indexación ${\ Displaystyle \ theta}$ es un vector en ${\ Displaystyle k}$ -espacio euclidiano dimensional , para algún entero no negativo ${\ Displaystyle k}$ . ^[1] Por lo tanto, ${\ Displaystyle \ theta}$ es de dimensión finita, y ${\ Displaystyle \ Theta \ subseteq \ mathbb {R} ^ {k}}$ .
Con un modelo no paramétrico , el conjunto de posibles valores del parámetro ${\ Displaystyle \ theta}$ es un subconjunto de un espacio ${\ Displaystyle V}$ , que no es necesariamente de dimensión finita. Por ejemplo, podríamos considerar el conjunto de todas las distribuciones con media 0. Dichos espacios son espacios vectoriales con estructura topológica , pero pueden no ser de dimensión finita como espacios vectoriales. Por lo tanto, ${\ Displaystyle \ Theta \ subseteq V}$ para algún espacio posiblemente de dimensión infinita ${\ Displaystyle V}$ .
Con un modelo semiparamétrico, el parámetro tiene un componente de dimensión finita y un componente de dimensión infinita (a menudo una función de valor real definida en la línea real). Por lo tanto, ${\ Displaystyle \ Theta \ subseteq \ mathbb {R} ^ {k} \ times V}$ , dónde ${\ Displaystyle V}$ es un espacio de dimensión infinita.

Al principio, puede parecer que los modelos semiparamétricos incluyen modelos no paramétricos, ya que tienen un componente de dimensión infinita y también de dimensión finita. Sin embargo, un modelo semiparamétrico se considera "más pequeño" que un modelo completamente no paramétrico porque a menudo solo nos interesa el componente de dimensión finita de ${\ Displaystyle \ theta}$ . Es decir, el componente de dimensión infinita se considera un parámetro molesto . ^[2] En los modelos no paramétricos, por el contrario, el interés principal es estimar el parámetro de dimensión infinita. Por tanto, la tarea de estimación es estadísticamente más difícil en modelos no paramétricos.

Estos modelos suelen utilizar suavizado o kernels .

Ejemplo

Un ejemplo bien conocido de modelo semiparamétrico es el modelo de riesgos proporcionales de Cox . ^[3] Si nos interesa estudiar la hora ${\ Displaystyle T}$ ante un evento como la muerte por cáncer o el fallo de una bombilla, el modelo de Cox especifica la siguiente función de distribución para ${\ Displaystyle T}$ :

{\ Displaystyle F (t) = 1- \ exp \ left (- \ int _ {0} ^ {t} \ lambda _ {0} (u) e ^ {\ beta 'x} du \ right),}

dónde ${\ Displaystyle x}$ es el vector covariable, y ${\ Displaystyle \ beta}$ y ${\ Displaystyle \ lambda _ {0} (u)}$ son parámetros desconocidos. ${\ Displaystyle \ theta = (\ beta, \ lambda _ {0} (u))}$ . Aquí ${\ Displaystyle \ beta}$ es de dimensión finita y es de interés; ${\ Displaystyle \ lambda _ {0} (u)}$ es una función del tiempo no negativa desconocida (conocida como función de riesgo de referencia) y, a menudo, es un parámetro molesto . El conjunto de posibles candidatos para ${\ Displaystyle \ lambda _ {0} (u)}$ es de dimensión infinita.

Ver también

Notas

^ Bickel, PJ; Klaassen, CAJ; Ritov, Y .; Wellner, JA (2006), "Semiparametrics", en Kotz, S .; et al. (eds.), Enciclopedia de Ciencias Estadísticas , Wiley.
^ Oakes, D. (2006), "Modelos semiparamétricos", en Kotz, S .; et al. (eds.), Enciclopedia de Ciencias Estadísticas , Wiley.
^ Balakrishnan, N .; Rao, CR (2004). Manual de estadística 23: Avances en el análisis de supervivencia . Elsevier . pag. 126.

Referencias

Bickel, PJ; Klaassen, CAJ; Ritov, Y .; Wellner, JA (1998), Estimación eficiente y adaptativa para modelos semiparamétricos , Springer
Härdle, Wolfgang; Müller, Marlene; Sperlich, Stefan; Werwatz, Axel (2004), Modelos no paramétricos y semiparamétricos , Springer
Kosorok, Michael R. (2008), Introducción a los procesos empíricos y la inferencia semiparamétrica , Springer
Tsiatis, Anastasios A. (2006), Teoría semiparamétrica y datos faltantes , Springer
Comenzado, Janet M .; Hall, WJ; Huang, Wei-Min; Wellner, Jon A. (1983), "Información y eficiencia asintótica en modelos paramétricos - no paramétricos", Annals of Statistics, 11 (1983), no. 2, 432--452

[ESS06--1] Bickel, PJ; Klaassen, CAJ; Ritov, Y .; Wellner, JA (2006), "Semiparametrics", en Kotz, S .; et al. (eds.), Enciclopedia de Ciencias Estadísticas , Wiley.

[ESS06-Oakes-2] Oakes, D. (2006), "Modelos semiparamétricos", en Kotz, S .; et al. (eds.), Enciclopedia de Ciencias Estadísticas , Wiley.

[BalakrishnanRao2004-3] Balakrishnan, N .; Rao, CR (2004). Manual de estadística 23: Avances en el análisis de supervivencia . Elsevier . pag. 126.

[1]