Identificabilidad

En estadística , la identificabilidad es una propiedad que un modelo debe satisfacer para que sea posible una inferencia precisa . Un modelo es identificable si es teóricamente posible aprender los valores verdaderos de los parámetros subyacentes de este modelo después de obtener un número infinito de observaciones de él. Matemáticamente, esto equivale a decir que diferentes valores de los parámetros deben generar diferentes distribuciones de probabilidad de las variables observables. Por lo general, el modelo es identificable solo bajo ciertas restricciones técnicas, en cuyo caso el conjunto de estos requisitos se denomina condiciones de identificación .

Se dice que un modelo que no es identificable es no identificable o no identificable : dos o más parametrizaciones son observacionalmente equivalentes . En algunos casos, aunque un modelo no sea identificable, aún es posible conocer los valores verdaderos de un cierto subconjunto de los parámetros del modelo. En este caso decimos que el modelo es parcialmente identificable . En otros casos, puede ser posible aprender la ubicación del parámetro verdadero hasta una cierta región finita del espacio de parámetros, en cuyo caso el modelo se establece como identificable .

Aparte de la exploración estrictamente teórica de las propiedades del modelo, se puede hacer referencia a la identificabilidad en un ámbito más amplio cuando un modelo se prueba con conjuntos de datos experimentales, utilizando análisis de identificabilidad . ^[1]

Definición

Dejar ${\ Displaystyle {\ mathcal {P}} = \ {P _ {\ theta}: \ theta \ in \ Theta \}}$ ser un modelo estadístico donde el espacio de parámetros ${\ Displaystyle \ Theta}$ es de dimensión finita o infinita. Nosotros decimos eso ${\ Displaystyle {\ mathcal {P}}}$ es identificable si el mapeo ${\ Displaystyle \ theta \ mapsto P _ {\ theta}}$ es uno a uno : ^[2]

{\ Displaystyle P _ {\ theta _ {1}} = P _ {\ theta _ {2}} \ quad \ Rightarrow \ quad \ theta _ {1} = \ theta _ {2} \ quad \ {\ text {para todos }} \ theta _ {1}, \ theta _ {2} \ in \ Theta.}

Esta definición significa que valores distintos de θ deben corresponder a distribuciones de probabilidad distintas: si θ ₁ ≠ θ ₂ , entonces también P _{θ ₁} ≠ P _{θ ₂} . ^[3] Si las distribuciones se definen en términos de las funciones de densidad de probabilidad (PDF), entonces dos PDF deben considerarse distintos solo si difieren en un conjunto de medidas distintas de cero (por ejemplo, dos funciones ƒ ₁ ( x ) = 1 _{0 ≤ x <1} y ƒ ₂ ( x ) = 1 _{0 ≤ x ≤ 1} difieren solo en un solo punto x = 1 - un conjunto de medidas cero - y por lo tanto no pueden considerarse como PDF distintos).

Identificabilidad del modelo en el sentido de invertibilidad del mapa ${\ Displaystyle \ theta \ mapsto P _ {\ theta}}$ es equivalente a poder aprender el verdadero parámetro del modelo si el modelo se puede observar indefinidamente. De hecho, si { X _t } ⊆ S es la secuencia de observaciones del modelo, entonces por la fuerte ley de los grandes números ,

{\ Displaystyle {\ frac {1} {T}} \ sum _ {t = 1} ^ {T} \ mathbf {1} _ {\ {X_ {t} \ in A \}} \ {\ xrightarrow {\ texto {as}}} \ \ Pr [X_ {t} \ in A],}

para cada conjunto medible A ⊆ S (aquí 1 _{...} es la función del indicador ). Por lo tanto, con un número infinito de observaciones podremos encontrar la verdadera distribución de probabilidad P ₀ en el modelo, y dado que la condición de identificabilidad anterior requiere que el mapa ${\ Displaystyle \ theta \ mapsto P _ {\ theta}}$ sea invertible, también podremos encontrar el verdadero valor del parámetro que generó dada la distribución P ₀ .

Ejemplos de

Ejemplo 1

Dejar ${\ Displaystyle {\ mathcal {P}}}$ ser la familia normal de escala de ubicación :

{\ Displaystyle {\ mathcal {P}} = {\ Big \ {} \ f _ {\ theta} (x) = {\ tfrac {1} {{\ sqrt {2 \ pi}} \ sigma}} e ^ { - {\ frac {1} {2 \ sigma ^ {2}}} (x- \ mu) ^ {2}} \ {\ Big |} \ \ theta = (\ mu, \ sigma): \ mu \ in \ mathbb {R}, \, \ sigma \!> 0 \ {\ Big \}}.}

Luego

{\ Displaystyle {\ begin {alineado} & f _ {\ theta _ {1}} = f _ {\ theta _ {2}} \\ [6pt] \ Longleftrightarrow {} & {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {1}}} \ exp \ left (- {\ frac {1} {2 \ sigma _ {1} ^ {2}}} (x- \ mu _ {1}) ^ { 2} \ right) = {\ frac {1} {{\ sqrt {2 \ pi}} \ sigma _ {2}}} \ exp \ left (- {\ frac {1} {2 \ sigma _ {2} ^ {2}}} (x- \ mu _ {2}) ^ {2} \ right) \\ [6pt] \ Longleftrightarrow {} & {\ frac {1} {\ sigma _ {1} ^ {2} }} (x- \ mu _ {1}) ^ {2} + \ ln \ sigma _ {1} = {\ frac {1} {\ sigma _ {2} ^ {2}}} (x- \ mu _ {2}) ^ {2} + \ ln \ sigma _ {2} \\ [6pt] \ Longleftrightarrow {} & x ^ {2} \ left ({\ frac {1} {\ sigma _ {1} ^ { 2}}} - {\ frac {1} {\ sigma _ {2} ^ {2}}} \ right) -2x \ left ({\ frac {\ mu _ {1}} {\ sigma _ {1} ^ {2}}} - {\ frac {\ mu _ {2}} {\ sigma _ {2} ^ {2}}} \ right) + \ left ({\ frac {\ mu _ {1} ^ { 2}} {\ sigma _ {1} ^ {2}}} - {\ frac {\ mu _ {2} ^ {2}} {\ sigma _ {2} ^ {2}}} + \ ln \ sigma _ {1} - \ ln \ sigma _ {2} \ right) = 0 \ end {alineado}}}

Esta expresión es igual a cero para casi todo x solo cuando todos sus coeficientes son iguales a cero, lo cual solo es posible cuando | σ ₁ | = | σ ₂ | y μ ₁ = μ ₂ . Dado que en el parámetro de escala σ está restringido a ser mayor que cero, concluimos que el modelo es identificable: ƒ _{θ ₁} = ƒ _{θ ₂} ⇔ θ ₁ = θ ₂ .

Ejemplo 2

Dejar ${\ Displaystyle {\ mathcal {P}}}$ ser el modelo de regresión lineal estándar :

{\ Displaystyle y = \ beta 'x + \ varepsilon, \ quad \ mathrm {E} [\, \ varepsilon \ mid x \,] = 0}

(donde ′ denota transposición de matriz ). Entonces el parámetro β es identificable si y solo si la matriz ${\ Displaystyle \ mathrm {E} [xx ']}$ es invertible. Por tanto, esta es la condición de identificación en el modelo.

Ejemplo 3

Suponer ${\ Displaystyle {\ mathcal {P}}}$ es el modelo lineal clásico de errores en variables :

{\ Displaystyle {\ begin {cases} y = \ beta x ^ {*} + \ varepsilon, \\ x = x ^ {*} + \ eta, \ end {cases}}}

donde ( ε , η , x * ) son variables aleatorias independientes normales conjuntamente con valor esperado cero y varianzas desconocidas, y solo se observan las variables ( x , y ). Entonces este modelo no es identificable, ^[4] solo el producto βσ² _∗ es (donde σ² _∗ es la varianza del regresor latente x * ). Este es también un ejemplo de un modelo identificable por conjuntos : aunque no se puede aprender el valor exacto de β , podemos garantizar que debe estar en algún lugar del intervalo ( β _yx , 1 ÷ β _xy ), donde β _yx es el coeficiente en MCO regresión de y sobre x , y β _xy es el coeficiente en la regresión MCO de x sobre y . ^[5]

Si abandonamos el supuesto de normalidad y requerimos que x * fueron no una distribución normal, conservando sólo la condición de independencia varepsilon ⊥ eta ⊥ x * , entonces el modelo se vuelve identificable. ^[4]

Software

En el caso de la estimación de parámetros en sistemas dinámicos parcialmente observados, la probabilidad del perfil también se puede utilizar para análisis de identificabilidad estructural y práctico. ^[6] Una implementación de [1] está disponible en MATLAB Toolbox PottersWheel .

Ver también

Referencias

Citas

^ Raue, A .; Kreutz, C .; Maiwald, T .; Bachmann, J .; Schilling, M .; Klingmuller, U .; Timmer, J. (1 de agosto de 2009). "Análisis de identificabilidad estructural y práctica de modelos dinámicos parcialmente observados mediante la explotación de la verosimilitud del perfil" . Bioinformática . 25 (15): 1923-1929. doi : 10.1093 / bioinformatics / btp358 . PMID 19505944 .
^ Lehmann y Casella 1998 , definición 1.5.2
↑ van der Vaart , 1998 , p. 62
↑ a b Reiersøl 1950
^ Casella y Berger 2001 , p. 583
^ Raue, A; Kreutz, C; Maiwald, T; Bachmann, J; Schilling, M; Klingmüller, U; Timmer, J (2009), "estructural y análisis identificabilidad práctica de modelos dinámicos parcialmente observada por la explotación de la probabilidad de perfil" , Bioinformática , 25 (15): 1923-9, doi : 10.1093 / bioinformática / btp358 , PMID 19505944 , archivado de la original el 13-01-2013.

Fuentes

Casella, George ; Berger, Roger L. (2002), Inferencia estadística (2a ed.), ISBN 0-534-24312-6, LCCN 2001025794CS1 maint: ref duplica el valor predeterminado ( enlace )
Hsiao, Cheng (1983), Identificación , Manual de Econometría, vol. 1, capítulo 4, empresa editorial de Holanda Septentrional
Lehmann, EL ; Casella, G. (1998), Teoría de la estimación puntual (2a ed.), Springer, ISBN 0-387-98502-6CS1 maint: ref duplica el valor predeterminado ( enlace )
Reiersøl, Olav (1950), "Identificabilidad de una relación lineal entre variables que están sujetas a error", Econometrica , 18 (4): 375–389, doi : 10.2307 / 1907835 , JSTOR 1907835
van der Vaart, AW (1998), Estadísticas asintóticas , Cambridge University Press , ISBN 978-0-521-49603-2

Otras lecturas

Walter, É. ; Pronzato, L. (1997), Identificación de modelos paramétricos a partir de datos experimentales , Springer

Econometría

Lewbel, Arthur (1 de diciembre de 2019). "El zoológico de identificación: significados de la identificación en econometría" . Revista de Literatura Económica . Asociación Económica Estadounidense. 57 (4): 835–903. doi : 10.1257 / jel.20181361 . ISSN 0022-0515 .
Matzkin, Rosa L. (2013). "Identificación no paramétrica en modelos económicos estructurales". Revisión anual de economía . 5 (1): 457–486. doi : 10.1146 / annurev-economics-082912-110231 .
Rothenberg, Thomas J. (1971). "Identificación en modelos paramétricos". Econometrica . 39 (3): 577–591. doi : 10.2307 / 1913267 . ISSN 0012-9682 . JSTOR 1913267 .

[1] Raue, A .; Kreutz, C .; Maiwald, T .; Bachmann, J .; Schilling, M .; Klingmuller, U .; Timmer, J. (1 de agosto de 2009). "Análisis de identificabilidad estructural y práctica de modelos dinámicos parcialmente observados mediante la explotación de la verosimilitud del perfil" . Bioinformática . 25 (15): 1923-1929. doi : 10.1093 / bioinformatics / btp358 . PMID 19505944 .

[2] Lehmann y Casella 1998 , definición 1.5.2

[3] van der Vaart , 1998 , p. 62

[riersol-4] Reiersøl 1950

[5] Casella y Berger 2001 , p. 583

[6] Raue, A; Kreutz, C; Maiwald, T; Bachmann, J; Schilling, M; Klingmüller, U; Timmer, J (2009), "estructural y análisis identificabilidad práctica de modelos dinámicos parcialmente observada por la explotación de la probabilidad de perfil" , Bioinformática , 25 (15): 1923-9, doi : 10.1093 / bioinformática / btp358 , PMID 19505944 , archivado de la original el 13-01-2013.

[1]