En estadística , econometría , ciencias políticas , epidemiología y disciplinas relacionadas, un diseño de regresión discontinua (RDD) es un diseño cuasi-experimental pretest-postest que tiene como objetivo determinar los efectos causales de las intervenciones asignando un punto de corte o umbral por encima o por debajo del cual un se asigna la intervención. Al comparar las observaciones que se encuentran de cerca a ambos lados del umbral, es posible estimar el efecto promedio del tratamiento en entornos en los que la asignación al azares inviable. Sin embargo, sigue siendo imposible hacer una verdadera inferencia causal con este método solo, ya que no rechaza automáticamente los efectos causales por ninguna variable de confusión potencial. Aplicado por primera vez por Donald Thistlethwaite y Donald Campbell a la evaluación de programas de becas, [1] el RDD se ha vuelto cada vez más popular en los últimos años. [2] Las comparaciones de estudios recientes de ensayos controlados aleatorios (ECA) y RDD han demostrado empíricamente la validez interna del diseño. [3]
Ejemplo
La intuición detrás del RDD está bien ilustrada usando la evaluación de becas basadas en méritos. El principal problema con la estimación del efecto causal de una intervención de este tipo es la homogeneidad del desempeño con la asignación del tratamiento (por ejemplo, la concesión de una beca). Dado que es más probable que los estudiantes de alto rendimiento obtengan la beca por mérito y continúen desempeñándose bien al mismo tiempo, comparar los resultados de los ganadores y los no beneficiarios conduciría a un sesgo al alza de las estimaciones. Incluso si la beca no mejorara las calificaciones en absoluto, los premiados habrían tenido un mejor desempeño que los no beneficiarios, simplemente porque las becas se otorgaron a estudiantes que tenían un buen desempeño ex ante .
A pesar de la ausencia de un diseño experimental , un RDD puede aprovechar las características exógenas de la intervención para provocar efectos causales . Si todos los estudiantes que superan un grado determinado, por ejemplo el 80%, reciben la beca, es posible obtener el efecto del tratamiento local comparando a los estudiantes en torno al límite del 80%. La intuición aquí es que un estudiante con una puntuación del 79% probablemente sea muy similar a un estudiante con una puntuación del 81%, dado el umbral predefinido del 80%. Sin embargo, un estudiante recibirá la beca y el otro no. Por lo tanto, comparar el resultado del adjudicatario (grupo de tratamiento) con el resultado contrafactual del no receptor (grupo de control) producirá el efecto del tratamiento local.
Metodología
Los dos enfoques más comunes para la estimación mediante un RDD son los no paramétricos y los paramétricos (normalmente regresión polinomial ).
Estimación no paramétrica
El método no paramétrico más común utilizado en el contexto de RDD es una regresión lineal local. Este es de la forma:
dónde es el corte del tratamiento y es una variable binaria igual a uno si . Dejando sea el ancho de banda de los datos utilizados, tenemos . Diferentes pendientes e intersecciones se ajustan a los datos a ambos lados del límite. Normalmente se utiliza un núcleo rectangular (sin ponderación) o un núcleo triangular. La investigación favorece el núcleo triangular, [4] pero el núcleo rectangular tiene una interpretación más sencilla. [5]
El principal beneficio de utilizar métodos no paramétricos en un RDD es que proporcionan estimaciones basadas en datos más cercanos al límite, lo que es intuitivamente atractivo. Esto reduce cierto sesgo que puede resultar del uso de datos más alejados del límite para estimar la discontinuidad en el límite. [5] Más formalmente, se prefieren las regresiones lineales locales porque tienen mejores propiedades de sesgo [4] y una mejor convergencia. [6] Sin embargo, el uso de ambos tipos de estimación, si es factible, es una forma útil de argumentar que los resultados estimados no dependen demasiado del enfoque particular adoptado.
Estimación paramétrica
Un ejemplo de estimación paramétrica es:
dónde
y es el límite del tratamiento. Tenga en cuenta que la parte polinomial se puede acortar o ampliar según las necesidades.
Otros ejemplos
- Políticas en las que el tratamiento está determinado por un criterio de elegibilidad por edad (por ejemplo, pensiones, edad mínima legal para beber). [7] [8]
- Elecciones en las que un político gana por mayoría marginal. [9] [10]
- Puntuaciones de ubicación dentro de la educación que clasifican a los estudiantes en programas de tratamiento. [11]
Supuestos requeridos
El diseño de regresión discontinua requiere que todas las variables potencialmente relevantes además de la variable de tratamiento y la variable de resultado sean continuas en el punto donde ocurren las discontinuidades del tratamiento y el resultado. Una condición suficiente, aunque no necesaria, [10] es si la asignación de tratamiento es "tan buena como aleatoria" en el umbral para el tratamiento. [9] Si esto es así, entonces garantiza que aquellos que apenas recibieron tratamiento son comparables a aquellos que apenas recibieron tratamiento, ya que el estado del tratamiento es efectivamente aleatorio.
La asignación de tratamiento en el umbral puede ser "tan buena como aleatoria" si hay aleatoriedad en la variable de asignación y los agentes considerados (individuos, empresas, etc.) no pueden manipular perfectamente su estado de tratamiento. Por ejemplo, suponga que el tratamiento es aprobar un examen, donde se requiere una calificación del 50%. En este caso, este ejemplo es un diseño de discontinuidad de regresión válido siempre que las calificaciones sean algo aleatorias, ya sea por la aleatoriedad de la calificación o por la aleatoriedad del desempeño de los estudiantes.
Los estudiantes tampoco deben poder manipular perfectamente su calificación para determinar perfectamente el estado de su tratamiento. Dos ejemplos incluyen a los estudiantes que pueden convencer a los maestros de que "aprueben misericordia", o que se les permita a los estudiantes volver a tomar el examen hasta que lo aprueben. En el primer caso, aquellos estudiantes que apenas fallan pero que pueden obtener un "pase de misericordia" pueden diferir de aquellos que apenas fallan pero que no pueden obtener un "pase de misericordia". Esto conduce a un sesgo de selección , ya que los grupos de tratamiento y control ahora difieren. En este último caso, algunos estudiantes pueden decidir volver a tomar el examen, deteniéndose una vez que lo aprueban. Esto también conduce a un sesgo de selección, ya que solo algunos estudiantes decidirán volver a tomar el examen. [5]
Prueba de la validez de los supuestos
Es imposible probar definitivamente la validez si los agentes pueden determinar perfectamente su estado de tratamiento. Sin embargo, algunas pruebas pueden proporcionar evidencia que respalda o descarta la validez del diseño de regresión discontinua.
Prueba de densidad
McCrary (2008) sugirió examinar la densidad de observaciones de la variable de asignación. [12] Suponga que hay una discontinuidad en la densidad de la variable de asignación en el umbral de tratamiento. En este caso, esto puede sugerir que algunos agentes pudieron manipular perfectamente su estado de tratamiento.
Por ejemplo, si varios estudiantes pueden obtener un "pase misericordioso", entonces habrá más estudiantes que apenas aprobaron el examen que los que apenas reprobaron. Del mismo modo, si a los estudiantes se les permite volver a tomar el examen hasta que lo aprueben, el resultado será similar. En ambos casos, esto probablemente se mostrará cuando se examine la densidad de calificaciones de los exámenes. "Jugar con el sistema" de esta manera podría sesgar la estimación del efecto del tratamiento.
Continuidad de variables observables
Dado que la validez del diseño de regresión discontinua se basa en que aquellos que apenas fueron tratados sean los mismos que aquellos que apenas fueron tratados, tiene sentido examinar si estos grupos se basan de manera similar en variables observables. Para el ejemplo anterior, se podría probar si aquellos que apenas aprobaron tienen características diferentes (demografía, ingresos familiares, etc.) que aquellos que apenas fallaron. Aunque algunas variables pueden diferir para los dos grupos según el azar, la mayoría de estas variables deben ser iguales. [13]
Pruebas de falsificación
Variables predeterminadas
De manera similar a la continuidad de las variables observables, se esperaría que hubiera continuidad en las variables predeterminadas en el punto de corte del tratamiento. Dado que estas variables se determinaron antes de la decisión del tratamiento, el estado del tratamiento no debería afectarlas. Considere el ejemplo anterior de una beca basada en el mérito. Si el resultado de interés son las calificaciones futuras, entonces no esperaríamos que la beca afecte las calificaciones anteriores. Si existe una discontinuidad en las variables predeterminadas en el punto de corte del tratamiento, esto pone en duda la validez del diseño de regresión discontinua.
Otras discontinuidades
Si hay discontinuidades en otros puntos de la variable de asignación, donde no se esperan, esto puede hacer que el diseño de discontinuidad de regresión sea sospechoso. Considere el ejemplo de Carpenter y Dobkin (2011) que estudiaron el efecto del acceso legal al alcohol en los Estados Unidos. [8] A medida que aumenta el acceso al alcohol a los 21 años, esto conduce a cambios en varios resultados, como las tasas de mortalidad y morbilidad. Si las tasas de mortalidad y morbilidad también aumentan de manera discontinua en otras edades, entonces se cuestiona la interpretación de la discontinuidad a los 21 años.
Inclusión y exclusión de covariables
Si las estimaciones de los parámetros son sensibles a la eliminación o adición de covariables al modelo, esto puede arrojar dudas sobre la validez del diseño de regresión discontinua. Un cambio significativo puede sugerir que aquellos que apenas recibieron tratamiento difieran en estas covariables de aquellos que apenas recibieron tratamiento. La inclusión de covariables eliminaría parte de este sesgo. Si hay una gran cantidad de sesgo, y las covariables explican una cantidad significativa de esto, entonces su inclusión o exclusión cambiaría significativamente la estimación del parámetro. [5]
Un trabajo reciente ha demostrado cómo agregar covariables, bajo qué condiciones hacerlo es válido y el potencial para una mayor precisión. [14]
Ventajas
- Cuando se implementa y analiza correctamente, el RDD produce una estimación no sesgada del efecto del tratamiento local. [15] El RDD puede ser casi tan bueno como un experimento aleatorio para medir el efecto de un tratamiento.
- El RDD, como cuasiexperimento , no requiere asignación al azar ex ante y elude los problemas éticos de la asignación aleatoria .
- Los estudios de RDD bien ejecutados pueden generar estimaciones del efecto del tratamiento similares a las estimaciones de los estudios aleatorizados. [dieciséis]
Desventajas
- Los efectos estimados solo son imparciales si la forma funcional de la relación entre el tratamiento y el resultado se modela correctamente. Las advertencias más populares son las relaciones no lineales que se confunden con una discontinuidad.
- Contaminación por otros tratamientos. Suponga que ocurre otro tratamiento en el mismo valor de corte de la misma variable de asignación. En ese caso, la discontinuidad medida en la variable de resultado puede atribuirse parcialmente a este otro tratamiento. Por ejemplo, suponga que un investigador desea estudiar el impacto del acceso legal al alcohol en la salud mental utilizando un diseño de regresión discontinua a la edad mínima legal para beber. El impacto medido podría confundirse con el acceso legal al juego, que puede ocurrir a la misma edad.
Extensiones
RDD difuso
La identificación de los efectos causales depende del supuesto crucial de que, de hecho, existe un límite agudo, alrededor del cual hay una discontinuidad en la probabilidad de asignación de 0 a 1. En realidad, sin embargo, los límites a menudo no se implementan estrictamente (p. Ej. discreción para los estudiantes que no lograron superar el umbral) y, por lo tanto, las estimaciones estarán sesgadas .
En contraste con el diseño de discontinuidad de regresión aguda, un diseño de discontinuidad de regresión difusa (FRDD) no requiere una discontinuidad aguda en la probabilidad de asignación. Aún así, es aplicable siempre que la probabilidad de asignación sea diferente. La intuición detrás de ella está relacionada con la estrategia de variable instrumental y la intención de tratar .
Diseño de retorcimiento de regresión
Cuando la variable de asignación es continua (por ejemplo, ayuda para estudiantes) y depende de manera predecible de otra variable observada (por ejemplo, ingresos familiares), se pueden identificar los efectos del tratamiento utilizando cambios bruscos en la pendiente de la función de tratamiento. Nielsen, Sørensen y Taber (2010) acuñaron esta técnica como diseño de regresión torcida , aunque citan análisis anteriores similares. [17] Escriben: "Este enfoque se asemeja a la idea de regresión discontinua. En lugar de una discontinuidad en el nivel de la función estipendio-ingreso, tenemos una discontinuidad en la pendiente de la función". Card et al. (2012) [18] y una aplicación empírica de Bockerman et al. (2018). [19]
Tenga en cuenta que las torceduras de regresión (o regresión torcida ) también pueden significar un tipo de regresión segmentada , que es un tipo diferente de análisis.
Consideraciones finales
El diseño de RD toma la forma de un diseño de investigación cuasi-experimental con una estructura clara que carece de características experimentales aleatorias. Varios aspectos niegan que los diseños de RD permitan un statu quo. Por ejemplo, los diseños a menudo involucran problemas serios que no ofrecen espacio para experimentos aleatorios. Además, el diseño de los experimentos depende de la precisión del proceso de modelado y de la relación entre entradas y salidas.
Ver también
- Cuasi-experimento
- Diseño de cuasiexperimentos
Referencias
- ^ Thistlethwaite, D .; Campbell, D. (1960). "Análisis de regresión-discontinuidad: una alternativa al experimento ex post facto". Revista de Psicología de la Educación . 51 (6): 309–317. doi : 10.1037 / h0044319 .
- ^ Imbens, G .; Lemieux, T. (2008). "Diseños de discontinuidad de regresión: una guía para la práctica" (PDF) . Revista de Econometría . 142 (2): 615–635. doi : 10.1016 / j.jeconom.2007.05.001 .
- ^ Chaplin, Duncan D .; Cook, Thomas D .; Zurovac, Jelena; Coopersmith, Jared S .; Finucane, Mariel M .; Vollmer, Lauren N .; Morris, Rebecca E. (2018). "La validez interna y externa del diseño de discontinuidad de regresión: un metaanálisis de 15 comparaciones dentro del estudio" . Revista de análisis y gestión de políticas . 37 (2): 403–429. doi : 10.1002 / pam.22051 . ISSN 1520-6688 .
- ^ a b Ventilador; Gijbels (1996). Modelado polinomial local y sus aplicaciones . Londres: Chapman y Hall. ISBN 978-0-412-98321-4.
- ^ a b c d Sotavento; Lemieux (2010). "Diseños de discontinuidad de regresión en economía" . Revista de Literatura Económica . 48 (2): 281–355. doi : 10.1257 / jel.48.2.281 . S2CID 14166110 .
- ^ Porter (2003). "Estimación en el modelo de regresión discontinuidad" (PDF) . Manuscrito inédito .
- ^ Duflo (2003). "Abuelas y nietas: pensiones de vejez y asignación intrafamiliar en Sudáfrica". Revisión económica del Banco Mundial . 17 (1): 1–25. doi : 10.1093 / wber / lhg013 . hdl : 10986/17173 .
- ^ a b Carpintero; Dobkin (2011). "La edad mínima legal para beber y la salud pública" . Revista de perspectivas económicas . 25 (2): 133-156. doi : 10.1257 / jep.25.2.133 . JSTOR 23049457 . PMC 3182479 . PMID 21595328 .
- ^ a b Lee (2008). "Experimentos aleatorios de selección no aleatoria en elecciones a la Cámara de Estados Unidos". Revista de Econometría . 142 (2): 675–697. CiteSeerX 10.1.1.409.5179 . doi : 10.1016 / j.jeconom.2007.05.004 .
- ^ a b de la Cuesta, B; Imai, K (2016). "Malentendidos sobre el diseño de discontinuidad de regresión en el estudio de elecciones cerradas" . Revista anual de ciencia política . 19 (1): 375–396. doi : 10.1146 / annurev-polisci-032015-010115 .
- ^ Moss, BG; Yeaton, WH; Lloyd, JE (2014). "Evaluación de la eficacia de las matemáticas del desarrollo mediante la incorporación de un experimento aleatorio dentro de un diseño de discontinuidad de regresión". Evaluación educativa y análisis de políticas . 36 (2): 170-185. doi : 10.3102 / 0162373713504988 . S2CID 123440758 .
- ^ a b McCrary (2008). "Manipulación de la variable de ejecución en el diseño de discontinuidad de regresión: una prueba de densidad". Revista de Econometría . 142 (2): 698–714. CiteSeerX 10.1.1.395.6501 . doi : 10.1016 / j.jeconom.2007.05.005 .
- ^ a b Sotavento; Moretti; Mayordomo (2004). "¿Los votantes afectan o eligen las políticas? Evidencia de la Cámara de los Estados Unidos". Revista Trimestral de Economía . 119 (3): 807–859. doi : 10.1162 / 0033553041502153 .
- ^ Calonico; Cattaneo; Farrell; Titiunik (2018). "Diseños de discontinuidad de regresión mediante covariables". arXiv : 1809.03904 [ econ.EM ].
- ^ Rubin (1977). "Asignación a tratamiento sobre la base de una covariable". Revista de estadísticas educativas y conductuales . 2 (1): 1–26. doi : 10.3102 / 10769986002001001 . S2CID 123013161 .
- ^ Moss, BG; Yeaton, WH; Lloyd, JE (2014). "Evaluación de la eficacia de las matemáticas del desarrollo mediante la incorporación de un experimento aleatorio dentro de un diseño de discontinuidad de regresión". Evaluación educativa y análisis de políticas . 36 (2): 170-185. doi : 10.3102 / 0162373713504988 . S2CID 123440758 .
- ^ Nielsen, HS; Sorensen, T .; Taber, CR (2010). "Estimación del efecto de la ayuda estudiantil en la matrícula universitaria: evidencia de una reforma de la política de subvenciones del gobierno". American Economic Journal: Política económica . 2 (2): 185–215. doi : 10.1257 / pol.2.2.185 . hdl : 10419/35588 . JSTOR 25760068 .
- ^ Card, David; Lee, David S .; Pei, Zhuan; Weber, Andrea (2012). "Reglas de política no lineal y la identificación y estimación de efectos causales en un diseño de retorcimiento de regresión generalizada" . Documento de trabajo NBER No. W18564 . doi : 10.3386 / w18564 . SSRN 2179402 .
- ^ Bockerman, Petri; Kanninen, Ohto; Suoniemi, Ilpo (2018). "Una torcedura que te enferma: el efecto de la paga por enfermedad en la ausencia" . Revista de Econometría Aplicada . 33 (4): 568–579. doi : 10.1002 / jae.2620 .
Otras lecturas
- Angrist, JD ; Pischke, J.-S. (2008). "Ponerse un poco nervioso: diseños de discontinuidad de regresión". Econometría mayoritariamente inofensiva: el compañero de un empirista . Prensa de la Universidad de Princeton. págs. 251-268. ISBN 978-0-691-12035-5.
- Cook, Thomas D. (2008). " ' Esperando a que llegue la vida': una historia del diseño de regresión-discontinuidad en psicología, estadística y economía". Revista de Econometría . 142 (2): 636–654. doi : 10.1016 / j.jeconom.2007.05.002 .
- Imbens, Guido W .; Wooldridge, Jeffrey M. (2009). "Desarrollos recientes en la econometría de la evaluación de programas" . Revista de Literatura Económica . 47 (1): 5–86. doi : 10.1257 / jel.47.1.5 .
- Maas, Iris L .; Nolte, Sandra; Walter, Otto B .; Berger, Thomas; Hautzinger, Martin (2017). "El diseño de regresión discontinua demostró ser una alternativa válida a un ensayo controlado aleatorio para estimar los efectos del tratamiento". Revista de epidemiología clínica . 82 : 94-102. doi : 10.1016 / j.jclinepi.2016.11.008 . PMID 27865902 .
enlaces externos
- Análisis de regresión-discontinuidad en la base de conocimientos de métodos de investigación