En estadística y econometría , el modelo probit multivariado es una generalización del modelo probit utilizado para estimar varios resultados binarios correlacionados de forma conjunta. Por ejemplo, si se cree que las decisiones de enviar al menos un niño a la escuela pública y la de votar a favor de un presupuesto escolar están correlacionadas (ambas decisiones son binarias), entonces el modelo probit multivariado sería apropiado para predecir conjuntamente estas dos opciones sobre una base específica para cada individuo. JR Ashford y RR Sowden propusieron inicialmente un enfoque para el análisis probit multivariante. [1] Siddhartha Chiby Edward Greenberg extendió esta idea y también propuso métodos de inferencia basados en simulación para el modelo probit multivariante que simplificaba y generalizaba la estimación de parámetros. [2]
Ejemplo: probit bivariado
En el modelo probit ordinario, solo hay una variable dependiente binaria y así solo una variable latente se utiliza. Por el contrario, en el modelo probit bivariado hay dos variables dependientes binarias y , por lo que hay dos variables latentes: y . Se asume que cada variable observada toma el valor 1 si y solo si su variable latente continua subyacente toma un valor positivo:
con
y
Ajustar el modelo probit bivariado implica estimar los valores de y . Para hacerlo, se debe maximizar la probabilidad del modelo . Esta probabilidad es
Sustituyendo las variables latentes y en las funciones de probabilidad y tomando registros da
Después de un poco de reescritura, la función de probabilidad logarítmica se convierte en:
Tenga en cuenta que es la función de distribución acumulativa de la distribución normal bivariada . y en la función logarítmica de verosimilitud se observan variables que son iguales a uno o cero.
Probit multivariante
Para el caso general, donde podemos llevar como opciones y como individuos u observaciones, la probabilidad de observar la elección es
Dónde y,
La función logarítmica de verosimilitud en este caso sería
Excepto por normalmente no hay una solución de forma cerrada para las integrales en la ecuación de verosimilitud logarítmica. En su lugar, se pueden utilizar métodos de simulación para simular las probabilidades de elección. Los métodos que utilizan el muestreo por importancia incluyen el algoritmo GHK (Geweke, Hajivassilou, McFadden y Keane), [3] AR (aceptar-rechazar), el método de Stern. También existen enfoques de MCMC para este problema, incluidos CRB (método de Chib con Rao-Blackwellization), CRT (Chib, Ritter, Tanner), ARK (kernel de aceptación-rechazo) y ASK (kernel de muestreo adaptativo). [4] En Probit-LMM (Mandt, Wenzel, Nakajima et al.) Se propone un enfoque variacional para escalar grandes conjuntos de datos. [5]
Referencias
- ^ Ashford, JR; Sowden, RR (septiembre de 1970). "Análisis probit multivariante" . Cite journal requiere
|journal=
( ayuda ) - ^ Chib, Siddhartha; Greenberg, Edward (junio de 1998). "Análisis de modelos probit multivariados" . Biometrika . 85 (2): 347–361. CiteSeerX 10.1.1.198.8541 . doi : 10.1093 / biomet / 85.2.347 - a través de Oxford Academic.
- ^ Hajivassiliou, Vassilis (1994). "Capítulo 40 Métodos clásicos de estimación para modelos LDV mediante simulación". Manual de Econometría . 4 : 2383–2441. doi : 10.1016 / S1573-4412 (05) 80009-1 . ISBN 9780444887665.
- ^ Jeliazkov, Ivan (2010). "Perspectivas de MCMC sobre estimación de verosimilitud simulada". Avances en Econometría . 26 : 3-39. doi : 10.1108 / S0731-9053 (2010) 0000026005 . ISBN 978-0-85724-149-8.
- ^ Mandt, Stephan; Wenzel, Florian; Nakajima, Shinichi; John, Cunningham; Lippert, Christoph; Kloft, Marius (2017). "Modelo mixto lineal probit disperso" (PDF) . Aprendizaje automático . 106 (9-10): 1-22. arXiv : 1507.04777 . doi : 10.1007 / s10994-017-5652-6 .
Otras lecturas
- Greene, William H., Análisis econométrico , séptima edición, Prentice-Hall, 2012.