En estadística , la identificabilidad es una propiedad que un modelo debe satisfacer para que sea posible una inferencia precisa . Un modelo es identificable si es teóricamente posible aprender los valores verdaderos de los parámetros subyacentes de este modelo después de obtener un número infinito de observaciones de él. Matemáticamente, esto equivale a decir que diferentes valores de los parámetros deben generar diferentes distribuciones de probabilidad de las variables observables. Por lo general, el modelo es identificable solo bajo ciertas restricciones técnicas, en cuyo caso el conjunto de estos requisitos se denomina condiciones de identificación .
Se dice que un modelo que no es identificable es no identificable o no identificable : dos o más parametrizaciones son observacionalmente equivalentes . En algunos casos, aunque un modelo no sea identificable, aún es posible conocer los valores verdaderos de un cierto subconjunto de los parámetros del modelo. En este caso decimos que el modelo es parcialmente identificable . En otros casos, puede ser posible aprender la ubicación del parámetro verdadero hasta una cierta región finita del espacio de parámetros, en cuyo caso el modelo se establece como identificable .
Aparte de la exploración estrictamente teórica de las propiedades del modelo, se puede hacer referencia a la identificabilidad en un ámbito más amplio cuando un modelo se prueba con conjuntos de datos experimentales, utilizando análisis de identificabilidad . [1]
Definición
Dejar ser un modelo estadístico donde el espacio de parámetroses de dimensión finita o infinita. Nosotros decimos esoes identificable si el mapeoes uno a uno : [2]
Esta definición significa que valores distintos de θ deben corresponder a distribuciones de probabilidad distintas: si θ 1 ≠ θ 2 , entonces también P θ 1 ≠ P θ 2 . [3] Si las distribuciones se definen en términos de las funciones de densidad de probabilidad (PDF), entonces dos PDF deben considerarse distintos solo si difieren en un conjunto de medidas distintas de cero (por ejemplo, dos funciones ƒ 1 ( x ) = 1 0 ≤ x <1 y ƒ 2 ( x ) = 1 0 ≤ x ≤ 1 difieren solo en un solo punto x = 1 - un conjunto de medidas cero - y por lo tanto no pueden considerarse como PDF distintos).
Identificabilidad del modelo en el sentido de invertibilidad del mapa es equivalente a poder aprender el verdadero parámetro del modelo si el modelo se puede observar indefinidamente. De hecho, si { X t } ⊆ S es la secuencia de observaciones del modelo, entonces por la fuerte ley de los grandes números ,
para cada conjunto medible A ⊆ S (aquí 1 {...} es la función del indicador ). Por lo tanto, con un número infinito de observaciones podremos encontrar la verdadera distribución de probabilidad P 0 en el modelo, y dado que la condición de identificabilidad anterior requiere que el mapasea invertible, también podremos encontrar el verdadero valor del parámetro que generó dada la distribución P 0 .
Ejemplos de
Ejemplo 1
Dejar ser la familia normal de escala de ubicación :
Luego
Esta expresión es igual a cero para casi todo x solo cuando todos sus coeficientes son iguales a cero, lo cual solo es posible cuando | σ 1 | = | σ 2 | y μ 1 = μ 2 . Dado que en el parámetro de escala σ está restringido a ser mayor que cero, concluimos que el modelo es identificable: ƒ θ 1 = ƒ θ 2 ⇔ θ 1 = θ 2 .
Ejemplo 2
Dejar ser el modelo de regresión lineal estándar :
(donde ′ denota transposición de matriz ). Entonces el parámetro β es identificable si y solo si la matrizes invertible. Por tanto, esta es la condición de identificación en el modelo.
Ejemplo 3
Suponer es el modelo lineal clásico de errores en variables :
donde ( ε , η , x * ) son variables aleatorias independientes normales conjuntamente con valor esperado cero y varianzas desconocidas, y solo se observan las variables ( x , y ). Entonces este modelo no es identificable, [4] solo el producto βσ² ∗ es (donde σ² ∗ es la varianza del regresor latente x * ). Este es también un ejemplo de un modelo identificable por conjuntos : aunque no se puede aprender el valor exacto de β , podemos garantizar que debe estar en algún lugar del intervalo ( β yx , 1 ÷ β xy ), donde β yx es el coeficiente en MCO regresión de y sobre x , y β xy es el coeficiente en la regresión MCO de x sobre y . [5]
Si abandonamos el supuesto de normalidad y requerimos que x * fueron no una distribución normal, conservando sólo la condición de independencia varepsilon ⊥ eta ⊥ x * , entonces el modelo se vuelve identificable. [4]
Software
En el caso de la estimación de parámetros en sistemas dinámicos parcialmente observados, la probabilidad del perfil también se puede utilizar para análisis de identificabilidad estructural y práctico. [6] Una implementación de [1] está disponible en MATLAB Toolbox PottersWheel .
Ver también
Referencias
Citas
- ^ Raue, A .; Kreutz, C .; Maiwald, T .; Bachmann, J .; Schilling, M .; Klingmuller, U .; Timmer, J. (1 de agosto de 2009). "Análisis de identificabilidad estructural y práctica de modelos dinámicos parcialmente observados mediante la explotación de la verosimilitud del perfil" . Bioinformática . 25 (15): 1923-1929. doi : 10.1093 / bioinformatics / btp358 . PMID 19505944 .
- ^ Lehmann y Casella 1998 , definición 1.5.2
- ↑ van der Vaart , 1998 , p. 62
- ↑ a b Reiersøl 1950
- ^ Casella y Berger 2001 , p. 583
- ^ Raue, A; Kreutz, C; Maiwald, T; Bachmann, J; Schilling, M; Klingmüller, U; Timmer, J (2009), "estructural y análisis identificabilidad práctica de modelos dinámicos parcialmente observada por la explotación de la probabilidad de perfil" , Bioinformática , 25 (15): 1923-9, doi : 10.1093 / bioinformática / btp358 , PMID 19505944 , archivado de la original el 13-01-2013.
Fuentes
- Casella, George ; Berger, Roger L. (2002), Inferencia estadística (2a ed.), ISBN 0-534-24312-6, LCCN 2001025794CS1 maint: ref duplica el valor predeterminado ( enlace )
- Hsiao, Cheng (1983), Identificación , Manual de Econometría, vol. 1, capítulo 4, empresa editorial de Holanda Septentrional
- Lehmann, EL ; Casella, G. (1998), Teoría de la estimación puntual (2a ed.), Springer, ISBN 0-387-98502-6CS1 maint: ref duplica el valor predeterminado ( enlace )
- Reiersøl, Olav (1950), "Identificabilidad de una relación lineal entre variables que están sujetas a error", Econometrica , 18 (4): 375–389, doi : 10.2307 / 1907835 , JSTOR 1907835
- van der Vaart, AW (1998), Estadísticas asintóticas , Cambridge University Press , ISBN 978-0-521-49603-2
Otras lecturas
- Walter, É. ; Pronzato, L. (1997), Identificación de modelos paramétricos a partir de datos experimentales , Springer
Econometría
- Lewbel, Arthur (1 de diciembre de 2019). "El zoológico de identificación: significados de la identificación en econometría" . Revista de Literatura Económica . Asociación Económica Estadounidense. 57 (4): 835–903. doi : 10.1257 / jel.20181361 . ISSN 0022-0515 .
- Matzkin, Rosa L. (2013). "Identificación no paramétrica en modelos económicos estructurales". Revisión anual de economía . 5 (1): 457–486. doi : 10.1146 / annurev-economics-082912-110231 .
- Rothenberg, Thomas J. (1971). "Identificación en modelos paramétricos". Econometrica . 39 (3): 577–591. doi : 10.2307 / 1913267 . ISSN 0012-9682 . JSTOR 1913267 .