Logit mixto

El logit mixto es un modelo estadístico completamente general para examinar opciones discretas . Supera tres limitaciones importantes del modelo logit estándar al permitir la variación aleatoria del sabor entre los selectores, los patrones de sustitución sin restricciones entre las opciones y la correlación de factores no observados a lo largo del tiempo. ^[1] Logit mixto puede elegir cualquier distribución ${\ Displaystyle f}$ para los coeficientes aleatorios, a diferencia de probit, que se limita a la distribución normal. Se llama "logit mixto" porque la probabilidad de elección es una mezcla de logits, con ${\ Displaystyle f}$ como la distribución de mezcla. ^[2] Se ha demostrado que un modelo logit mixto puede aproximarse con cualquier grado de precisión a cualquier modelo de utilidad aleatorio verdadero de elección discreta, dada la especificación adecuada de las variables y la distribución de coeficientes. ^[3]

Variación de sabor aleatoria

Los coeficientes de "gusto" del modelo logit estándar, o ${\ Displaystyle \ beta}$ son fijos, lo que significa que ${\ Displaystyle \ beta}$ son iguales para todos. El logit mixto tiene diferentes ${\ Displaystyle \ beta}$ es para cada persona (es decir, cada tomador de decisiones).

En el modelo logit estándar, la utilidad de persona ${\ Displaystyle n}$ para alternativa ${\ Displaystyle i}$ es:

{\ Displaystyle U_ {ni} = \ beta x_ {ni} + \ varepsilon _ {ni}}

con

{\ Displaystyle \ varepsilon _ {ni}}

~ iid valor extremo

Para el modelo logit mixto, esta especificación se generaliza al permitir ${\ Displaystyle \ beta _ {n}}$ ser aleatorio. La utilidad de la persona ${\ Displaystyle n}$ para alternativa ${\ Displaystyle i}$ en el modelo logit mixto es:

{\ Displaystyle U_ {ni} = \ beta _ {n} x_ {ni} + \ varepsilon _ {ni}}

con

{\ Displaystyle \ varepsilon _ {ni}}

~ iid valor extremo

{\ Displaystyle \ quad \ beta _ {n} \ sim f (\ beta | \ theta)}

donde θ son los parámetros de la distribución de ${\ Displaystyle \ beta _ {n}}$ está por encima de la población, como la media y la varianza de ${\ Displaystyle \ beta _ {n}}$ .

Condicionado a ${\ Displaystyle \ beta _ {n}}$ , la probabilidad de que esa persona ${\ Displaystyle n}$ elige alternativa ${\ Displaystyle i}$ es la fórmula logit estándar:

{\ Displaystyle L_ {ni} (\ beta _ {n}) = {\ frac {e ^ {\ beta _ {n} X_ {ni}}} {\ sum _ {j} e ^ {\ beta _ {n } X_ {nj}}}}}

Sin embargo, desde ${\ Displaystyle \ beta _ {n}}$ es aleatorio y no conocido, la probabilidad de elección (incondicional) es la integral de esta fórmula logit sobre la densidad de ${\ Displaystyle \ beta _ {n}}$ .

{\ Displaystyle P_ {ni} = \ int L_ {ni} (\ beta) f (\ beta | \ theta) d \ beta}

Este modelo también se denomina modelo logit de coeficientes aleatorios ya que ${\ Displaystyle \ beta _ {n}}$ es una variable aleatoria. Permite que las pendientes de utilidad (es decir, la utilidad marginal) sean aleatorias, que es una extensión del modelo de efectos aleatorios donde solo la intersección era estocástica.

Se puede especificar cualquier función de densidad de probabilidad para la distribución de los coeficientes en la población, es decir, para ${\ Displaystyle f (\ beta | \ theta)}$ . La distribución más utilizada es la normal, principalmente por su sencillez. Para los coeficientes que toman el mismo signo para todas las personas, como un coeficiente de precio que es necesariamente negativo o el coeficiente de un atributo deseable, se utilizan distribuciones con soporte en un solo lado de cero, como el logarítmico normal. ^[4]^[5] Cuando los coeficientes lógicamente no pueden ser ilimitadamente grandes o pequeños, a menudo se utilizan distribuciones acotadas, como la ${\ Displaystyle S_ {b}}$ o distribuciones triangulares.

Patrones de sustitución sin restricciones

El modelo logit mixto puede representar un patrón de sustitución general porque no exhibe la propiedad de independencia restrictiva de logit de las alternativas irrelevantes (IIA). El cambio porcentual en persona ${\ Displaystyle n}$ probabilidad incondicional de elegir una alternativa ${\ Displaystyle i}$ dado un cambio porcentual en el m- ésimo atributo de alternativa ${\ Displaystyle j}$ (la elasticidad de ${\ Displaystyle P_ {ni}}$ con respecto a ${\ Displaystyle x_ {nj} ^ {m}}$ ) es

{\ Displaystyle Elasticity_ {P_ {ni}, x_ {nj} ^ {m}} = - {\ frac {x_ {nj} ^ {m}} {P_ {ni}}} \ int \ beta ^ {m} L_ {ni} (\ beta) L_ {nj} (\ beta) f (\ beta) d \ beta = -x_ {nj} ^ {m} \ int \ beta ^ {m} L_ {nj} (\ beta) { \ frac {L_ {ni} (\ beta)} {P_ {ni}}} f (\ beta) d \ beta}

dónde ${\ Displaystyle \ beta ^ {m}}$ es el m- ésimo elemento de ${\ Displaystyle \ beta}$ . ^[1]^[5] Se puede ver en esta fórmula que una reducción del diez por ciento para ${\ Displaystyle P_ {ni}}$ No es necesario que implique (como con logit) una reducción del diez por ciento en cada una de las alternativas. ${\ Displaystyle P_ {nj}}$ . ^[1] La razón es que los porcentajes relativos dependen de la correlación entre la probabilidad condicional de que esa persona ${\ Displaystyle n}$ elegirá una alternativa ${\ Displaystyle i, L_ {ni},}$ y la probabilidad condicional de que esa persona ${\ Displaystyle n}$ elegirá una alternativa ${\ Displaystyle j, L_ {nj},}$ sobre varios sorteos de ${\ Displaystyle \ beta}$ .

Correlación de factores no observados a lo largo del tiempo

El logit estándar no tiene en cuenta ningún factor no observado que persista en el tiempo para un tomador de decisiones determinado. Esto puede ser un problema si está utilizando datos de panel, que representan opciones repetidas a lo largo del tiempo. Al aplicar un modelo logit estándar a los datos de panel, está asumiendo que los factores no observados que afectan la elección de una persona son nuevos cada vez que la persona hace la elección. Esa es una suposición muy poco probable. Para tener en cuenta tanto la variación aleatoria del gusto como la correlación en factores no observados a lo largo del tiempo, la utilidad para el encuestado n para la alternativa i en el momento t se especifica de la siguiente manera:

{\ Displaystyle U_ {nit} = \ beta _ {n} X_ {nit} + \ varepsilon _ {nit}}

donde el subíndice t es la dimensión de tiempo. Todavía hacemos la suposición logit que es que ${\ Displaystyle \ varepsilon}$ es un valor extremo de iid. Eso significa que ${\ Displaystyle \ varepsilon}$ es independiente en el tiempo, las personas y las alternativas. ${\ Displaystyle \ varepsilon}$ es esencialmente ruido blanco. Sin embargo, la correlación a lo largo del tiempo y las alternativas surge del efecto común de la ${\ Displaystyle \ beta}$ 's, que ingresan utilidad en cada período de tiempo y cada alternativa.

Para examinar la correlación explícitamente, suponga que las β se distribuyen normalmente con la media ${\ displaystyle {\ bar {\ beta}}}$ y varianza ${\ Displaystyle \ sigma ^ {2}}$ . Entonces la ecuación de utilidad se convierte en:

{\ Displaystyle U_ {nit} = ({\ bar {\ beta}} + \ sigma \ eta _ {n}) X_ {nit} + \ varepsilon _ {nit}}

y η es una extracción de la densidad normal estándar. Reordenando, la ecuación se convierte en:

{\ Displaystyle U_ {nit} = {\ bar {\ beta}} X_ {nit} + (\ sigma \ eta _ {n} X_ {nit} + \ varepsilon _ {nit})}

{\ Displaystyle U_ {nit} = {\ bar {\ beta}} X_ {nit} + e_ {nit}}

donde los factores no observados se recogen en ${\ Displaystyle e_ {nit} = \ sigma \ eta _ {n} X_ {nit} + \ varepsilon _ {nit}}$ . De los factores no observados, ${\ Displaystyle \ varepsilon _ {nit}}$ es independiente en el tiempo, y ${\ Displaystyle \ sigma \ eta _ {n} X_ {nit}}$ no es independiente en el tiempo ni en las alternativas.

Entonces la covarianza entre alternativas ${\ Displaystyle i}$ y ${\ Displaystyle j}$ es,

{\ Displaystyle Cov (e_ {nit}, e_ {njt}) = \ sigma ^ {2} (X_ {nit} X_ {njt})}

y la covarianza entre el tiempo ${\ Displaystyle t}$ y ${\ Displaystyle q}$ es

{\ Displaystyle Cov (e_ {nit}, e_ {niq}) = \ sigma ^ {2} (X_ {nit} X_ {niq})}

Al especificar las X de forma adecuada, se puede obtener cualquier patrón de covarianza en el tiempo y las alternativas.

Condicionado a ${\ Displaystyle \ beta _ {n}}$ , la probabilidad de la secuencia de elecciones de una persona es simplemente el producto de la probabilidad logit de cada elección individual de esa persona:

{\ Displaystyle L_ {n} (\ beta _ {n}) = \ prod _ {t} {\ frac {e ^ {\ beta _ {n} X_ {nit}}} {\ sum _ {j} e ^ {\ beta _ {n} X_ {njt}}}}}

desde ${\ Displaystyle \ varepsilon _ {nit}}$ es independiente en el tiempo. Entonces, la probabilidad (incondicional) de la secuencia de elecciones es simplemente la integral de este producto de logits sobre la densidad de ${\ Displaystyle \ beta}$ .

{\ Displaystyle P_ {ni} = \ int L_ {n} (\ beta) f (\ beta | \ theta) d \ beta}

Simulación

Desafortunadamente, no existe una forma cerrada para la integral que ingresa a la probabilidad de elección, por lo que el investigador debe simular P _n . Afortunadamente para el investigador, simular P _n puede ser muy sencillo. Hay cuatro pasos básicos a seguir

1. Extraiga la función de densidad de probabilidad que especificó para los coeficientes de "sabor". Es decir, toma un sorteo de ${\ Displaystyle f (\ beta | \ theta)}$ y etiquetar el sorteo ${\ Displaystyle \ beta ^ {r}}$ , por ${\ Displaystyle r = 1}$ que representa el primer sorteo.

2. Calcular ${\ Displaystyle L_ {n} (\ beta ^ {r})}$ . (La probabilidad condicional).

3. Repita muchas veces, por ${\ Displaystyle r = 2, ..., R}$ .

4. Promedio de los resultados

Entonces, la fórmula para la simulación se parece a la siguiente,

${\ Displaystyle {\ tilde {P}} _ {ni} = {\ frac {\ sum _ {r} L_ {ni} (\ beta ^ {r})} {R}}}$

donde R es el número total de extracciones extraídas de la distribución y r es una extracción.

Una vez hecho esto, tendrá un valor para la probabilidad de cada alternativa i para cada encuestado n.

Ver también

Elección discreta

Otras lecturas

Ch. 6 de métodos de elección discreta con simulación , por Kenneth Train ( Cambridge University Press )

Referencias

^ ^a ^b ^c Train, K. (2003) Métodos de elección discreta con simulación
^ Hensher, David A. y William H. Greene (2003). "El modelo logit mixto: el estado de la práctica", Transporte , vol. 30, págs. 133-176, en pág. 135.
^ McFadden, D. y Train, K. (2000). “ Modelos de MNL mixtos para respuesta discreta ”, Journal of Applied Econometrics , vol. 15, núm. 5, págs. 447-470.
^ David Revelt y Train, K (1998). " Logit mixto con opciones repetidas: opciones de los hogares sobre el nivel de eficiencia de los electrodomésticos ", Revisión de economía y estadísticas, vol. 80, núm. 4, págs.647-657
^ ^a ^b Train, K (1998). " Modelos de demanda de recreación con variación de gusto" , Economía de la tierra, vol. 74, núm. 2, págs. 230-239.

[dca-1] Train, K. (2003) Métodos de elección discreta con simulación

[2] Hensher, David A. y William H. Greene (2003). "El modelo logit mixto: el estado de la práctica", Transporte , vol. 30, págs. 133-176, en pág. 135.

[mt-mnl-3] McFadden, D. y Train, K. (2000). “ Modelos de MNL mixtos para respuesta discreta ”, Journal of Applied Econometrics , vol. 15, núm. 5, págs. 447-470.

[rt-4] David Revelt y Train, K (1998). " Logit mixto con opciones repetidas: opciones de los hogares sobre el nivel de eficiencia de los electrodomésticos ", Revisión de economía y estadísticas, vol. 80, núm. 4, págs.647-657

[rec-5] Train, K (1998). " Modelos de demanda de recreación con variación de gusto" , Economía de la tierra, vol. 74, núm. 2, págs. 230-239.

[1]