El logit mixto es un modelo estadístico completamente general para examinar opciones discretas . Supera tres limitaciones importantes del modelo logit estándar al permitir la variación aleatoria del sabor entre los selectores, los patrones de sustitución sin restricciones entre las opciones y la correlación de factores no observados a lo largo del tiempo. [1] Logit mixto puede elegir cualquier distribuciónpara los coeficientes aleatorios, a diferencia de probit, que se limita a la distribución normal. Se llama "logit mixto" porque la probabilidad de elección es una mezcla de logits, concomo la distribución de mezcla. [2] Se ha demostrado que un modelo logit mixto puede aproximarse con cualquier grado de precisión a cualquier modelo de utilidad aleatorio verdadero de elección discreta, dada la especificación adecuada de las variables y la distribución de coeficientes. [3]
Variación de sabor aleatoria
Los coeficientes de "gusto" del modelo logit estándar, o son fijos, lo que significa que son iguales para todos. El logit mixto tiene diferenteses para cada persona (es decir, cada tomador de decisiones).
En el modelo logit estándar, la utilidad de persona para alternativa es:
con
- ~ iid valor extremo
Para el modelo logit mixto, esta especificación se generaliza al permitir ser aleatorio. La utilidad de la persona para alternativa en el modelo logit mixto es:
con
- ~ iid valor extremo
donde θ son los parámetros de la distribución deestá por encima de la población, como la media y la varianza de .
Condicionado a , la probabilidad de que esa persona elige alternativa es la fórmula logit estándar:
Sin embargo, desde es aleatorio y no conocido, la probabilidad de elección (incondicional) es la integral de esta fórmula logit sobre la densidad de .
Este modelo también se denomina modelo logit de coeficientes aleatorios ya que es una variable aleatoria. Permite que las pendientes de utilidad (es decir, la utilidad marginal) sean aleatorias, que es una extensión del modelo de efectos aleatorios donde solo la intersección era estocástica.
Se puede especificar cualquier función de densidad de probabilidad para la distribución de los coeficientes en la población, es decir, para. La distribución más utilizada es la normal, principalmente por su sencillez. Para los coeficientes que toman el mismo signo para todas las personas, como un coeficiente de precio que es necesariamente negativo o el coeficiente de un atributo deseable, se utilizan distribuciones con soporte en un solo lado de cero, como el logarítmico normal. [4] [5] Cuando los coeficientes lógicamente no pueden ser ilimitadamente grandes o pequeños, a menudo se utilizan distribuciones acotadas, como la o distribuciones triangulares.
Patrones de sustitución sin restricciones
El modelo logit mixto puede representar un patrón de sustitución general porque no exhibe la propiedad de independencia restrictiva de logit de las alternativas irrelevantes (IIA). El cambio porcentual en personaprobabilidad incondicional de elegir una alternativa dado un cambio porcentual en el m- ésimo atributo de alternativa(la elasticidad de con respecto a ) es
dónde es el m- ésimo elemento de. [1] [5] Se puede ver en esta fórmula que una reducción del diez por ciento para No es necesario que implique (como con logit) una reducción del diez por ciento en cada una de las alternativas. . [1] La razón es que los porcentajes relativos dependen de la correlación entre la probabilidad condicional de que esa persona elegirá una alternativa y la probabilidad condicional de que esa persona elegirá una alternativa sobre varios sorteos de .
Correlación de factores no observados a lo largo del tiempo
El logit estándar no tiene en cuenta ningún factor no observado que persista en el tiempo para un tomador de decisiones determinado. Esto puede ser un problema si está utilizando datos de panel, que representan opciones repetidas a lo largo del tiempo. Al aplicar un modelo logit estándar a los datos de panel, está asumiendo que los factores no observados que afectan la elección de una persona son nuevos cada vez que la persona hace la elección. Esa es una suposición muy poco probable. Para tener en cuenta tanto la variación aleatoria del gusto como la correlación en factores no observados a lo largo del tiempo, la utilidad para el encuestado n para la alternativa i en el momento t se especifica de la siguiente manera:
donde el subíndice t es la dimensión de tiempo. Todavía hacemos la suposición logit que es quees un valor extremo de iid. Eso significa que es independiente en el tiempo, las personas y las alternativas. es esencialmente ruido blanco. Sin embargo, la correlación a lo largo del tiempo y las alternativas surge del efecto común de la's, que ingresan utilidad en cada período de tiempo y cada alternativa.
Para examinar la correlación explícitamente, suponga que las β se distribuyen normalmente con la media y varianza . Entonces la ecuación de utilidad se convierte en:
y η es una extracción de la densidad normal estándar. Reordenando, la ecuación se convierte en:
donde los factores no observados se recogen en . De los factores no observados, es independiente en el tiempo, y no es independiente en el tiempo ni en las alternativas.
Entonces la covarianza entre alternativas y es,
y la covarianza entre el tiempo y es
Al especificar las X de forma adecuada, se puede obtener cualquier patrón de covarianza en el tiempo y las alternativas.
Condicionado a , la probabilidad de la secuencia de elecciones de una persona es simplemente el producto de la probabilidad logit de cada elección individual de esa persona:
desde es independiente en el tiempo. Entonces, la probabilidad (incondicional) de la secuencia de elecciones es simplemente la integral de este producto de logits sobre la densidad de.
Simulación
Desafortunadamente, no existe una forma cerrada para la integral que ingresa a la probabilidad de elección, por lo que el investigador debe simular P n . Afortunadamente para el investigador, simular P n puede ser muy sencillo. Hay cuatro pasos básicos a seguir
1. Extraiga la función de densidad de probabilidad que especificó para los coeficientes de "sabor". Es decir, toma un sorteo de y etiquetar el sorteo , por que representa el primer sorteo.
2. Calcular . (La probabilidad condicional).
3. Repita muchas veces, por .
4. Promedio de los resultados
Entonces, la fórmula para la simulación se parece a la siguiente,
donde R es el número total de extracciones extraídas de la distribución y r es una extracción.
Una vez hecho esto, tendrá un valor para la probabilidad de cada alternativa i para cada encuestado n.
Ver también
Otras lecturas
Referencias
- ^ a b c Train, K. (2003) Métodos de elección discreta con simulación
- ^ Hensher, David A. y William H. Greene (2003). "El modelo logit mixto: el estado de la práctica", Transporte , vol. 30, págs. 133-176, en pág. 135.
- ^ McFadden, D. y Train, K. (2000). “ Modelos de MNL mixtos para respuesta discreta ”, Journal of Applied Econometrics , vol. 15, núm. 5, págs. 447-470.
- ^ David Revelt y Train, K (1998). " Logit mixto con opciones repetidas: opciones de los hogares sobre el nivel de eficiencia de los electrodomésticos ", Revisión de economía y estadísticas, vol. 80, núm. 4, págs.647-657
- ^ a b Train, K (1998). " Modelos de demanda de recreación con variación de gusto" , Economía de la tierra, vol. 74, núm. 2, págs. 230-239.