Teoría del campo de decisión


De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a búsqueda

La teoría del campo de decisión ( DFT ) es un enfoque cognitivo-dinámico para la toma de decisiones humana. Es un modelo cognitivo que describe cómo las personas realmente toman decisiones en lugar de una teoría racional o normativa que prescribe lo que las personas deberían o deberían hacer. También es un modelo dinámico de toma de decisiones en lugar de un modelo estático, porque describe cómo las preferencias de una persona evolucionan a lo largo del tiempo hasta que se toma una decisión en lugar de asumir un estado de preferencia fijo. El proceso de evolución de las preferencias se representa matemáticamente como un proceso estocástico llamado proceso de difusión.. Se utiliza para predecir cómo los humanos toman decisiones en condiciones de incertidumbre, cómo cambian las decisiones bajo la presión del tiempo y cómo el contexto de elección cambia las preferencias. Este modelo se puede utilizar para predecir no solo las elecciones que se toman, sino también los tiempos de decisión o respuesta .

El artículo "Decision Field Theory" fue publicado por Jerome R. Busemeyer y James T. Townsend en 1993. [1] [2] [3] [4] Se ha demostrado que la DFT explica muchos hallazgos desconcertantes con respecto al comportamiento de elección humana, incluyendo violaciones de la dominancia estocástica , violaciones de la transitividad estocástica fuerte , [5] [6] [7] violaciones de la independencia entre alternativas, efectos de posición en seriesobre preferencia, efectos de compensación de precisión de velocidad, relación inversa entre probabilidad y tiempo de decisión, cambios en decisiones bajo presión de tiempo, así como reversiones de preferencias entre elecciones y precios. La DFT también ofrece un puente hacia la neurociencia . [8] Recientemente, los autores de la teoría del campo de decisión también han comenzado a explorar una nueva dirección teórica llamada Cognición Cuántica .

Introducción

Se eligió el nombre de teoría del campo de decisión para reflejar el hecho de que la inspiración para esta teoría proviene de un enfoque anterior: modelo de evitación del conflicto contenido en la teoría psicológica general de Kurt Lewin , a la que llamó teoría de campo . DFT es un miembro de una clase general de modelos de muestreo secuencial que se utilizan comúnmente en una variedad de campos de la cognición. [9] [10] [11] [12] [13] [14] [15]

Las ideas básicas que subyacen al proceso de decisión para los modelos de muestreo secuencial se ilustran en la Figura 1 a continuación. Suponga que al tomador de decisiones se le presenta inicialmente una elección entre tres prospectos riesgosos, A, B, C, en el tiempo t = 0. El eje horizontal en la figura representa el tiempo de deliberación (en segundos) y el eje vertical representa la fuerza de la preferencia. Cada trayectoria en la figura representa el estado de preferencia por uno de los prospectos riesgosos en cada momento. [4]

Figura 1 - Rutas de muestra para un proceso de difusión

Intuitivamente, en cada momento, el tomador de decisiones piensa en varios beneficios de cada prospecto, lo que produce una reacción afectiva, o valencia, para cada prospecto. Estas valencias se integran a lo largo del tiempo para producir el estado de preferencia en cada momento. En este ejemplo, durante las primeras etapas del procesamiento (entre 200 y 300 ms), la atención se centra en las ventajas que favorecen al prospecto C, pero más tarde (después de 600 ms) la atención se desplaza hacia las ventajas que favorecen al prospecto A. La regla de detención para este proceso es controlado por un umbral (que se establece igual a 1.0 en este ejemplo): se acepta el primer prospecto que alcanza el umbral superior, que en este caso es el prospecto A después de unos dos segundos. La probabilidad de elección está determinada por la primera opción para ganar la carrera y cruzar el umbral superior,y el tiempo de decisión es igual al tiempo de deliberación requerido por uno de los prospectos para alcanzar este umbral.[4]

El umbral es un parámetro importante para controlar las compensaciones entre velocidad y precisión. Si el umbral se establece en un valor más bajo (alrededor de .30) en la Figura 1, entonces se elegiría el prospecto C en lugar del prospecto A (y lo hizo antes). Por lo tanto, las decisiones pueden revertirse bajo la presión del tiempo. [dieciséis]Los umbrales altos requieren que se alcance un estado de preferencia fuerte, lo que permite muestrear más información sobre los prospectos, prolongando el proceso de deliberación y aumentando la precisión. Los umbrales bajos permiten que un estado de preferencia débil determine la decisión, lo que corta la información de muestreo sobre los prospectos, acortando el proceso de deliberación y disminuyendo la precisión. Bajo una gran presión de tiempo, los responsables de la toma de decisiones deben elegir un umbral bajo; pero bajo una presión de tiempo baja, se puede usar un umbral más alto para aumentar la precisión. Los tomadores de decisiones muy cuidadosos y deliberativos tienden a usar un umbral alto, y los tomadores de decisiones impulsivos y descuidados usan un umbral bajo. [4]Para proporcionar una descripción un poco más formal de la teoría, suponga que el tomador de decisiones puede elegir entre tres acciones, y también suponga para simplificar que solo hay cuatro posibles resultados finales. Por tanto, cada acción se define mediante una distribución de probabilidad entre estos cuatro resultados. Los valores afectivos producidos por cada pago están representados por los valores m j . En cualquier momento, el tomador de decisiones anticipa la recompensa de cada acción, lo que produce una evaluación momentánea, U i (t), para la acción i. Esta evaluación momentánea es un promedio ponderado por la atención de la evaluación afectiva de cada recompensa: U i (t) = Σ W ij (t) m j . El peso de la atención en el tiempo t, W ij(t), para el pago j ofrecido por la acción i, se supone que fluctúa de acuerdo con un proceso estocástico estacionario. Esto refleja la idea de que la atención está cambiando de un momento a otro, provocando cambios en la recompensa anticipada de cada acción a lo largo del tiempo. La evaluación momentánea de cada acción se compara con otras acciones para formar una valencia para cada acción en cada momento, v i (t) = U i(t) - U. (t), donde U. (t) es igual al promedio de todas las acciones momentáneas. La valencia representa la ventaja o desventaja momentánea de cada acción. La valencia total se equilibra a cero, por lo que todas las opciones no pueden volverse atractivas simultáneamente. Finalmente, las valencias son las entradas a un sistema dinámico que integra las valencias a lo largo del tiempo para generar los estados de preferencia de salida. El estado preferencia de salida para i acción en el tiempo t se simboliza como P i (t). El sistema dinámico se describe mediante la siguiente ecuación de diferencia estocástica lineal para un pequeño paso de tiempo h en el proceso de deliberación: P i (t + h) = Σ s ij P j (t) + v i (t + h). coeficiente de retroalimentación propia, s ii= s> 0, controla la memoria para valencias de entrada pasadas para un estado de preferencia. Los valores de s ii <1 sugieren un deterioro en la memoria o el impacto de valencias anteriores a lo largo del tiempo, mientras que los valores de s ii > 1 sugieren un crecimiento del impacto a lo largo del tiempo (efectos de primacía). Los coeficientes de retroalimentación lateral negativa, s ij = s ji<0 para i no igual a j, produce competencia entre acciones de modo que los fuertes inhiben a los débiles. En otras palabras, a medida que la preferencia por una acción se hace más fuerte, esto modera la preferencia por otras acciones. Se supone que las magnitudes de los coeficientes inhibidores laterales son una función creciente de la similitud entre las opciones de elección. Estos coeficientes inhibidores laterales son importantes para explicar los efectos del contexto sobre las preferencias que se describen más adelante. Formalmente, este es un proceso de Markov; Las fórmulas matriciales se han obtenido matemáticamente para calcular las probabilidades de elección y la distribución de los tiempos de respuesta de elección. [4]

La teoría del campo de decisión también puede verse como una teoría dinámica y estocástica de caminata aleatoria de la toma de decisiones, presentada como un modelo posicionado entre patrones de activación neuronal de nivel inferior y nociones más complejas de toma de decisiones que se encuentran en la psicología y la economía. [4]

Explicando los efectos del contexto

La DFT es capaz de explicar los efectos del contexto que muchas teorías de toma de decisiones no pueden explicar. [17]

Muchos modelos probabilísticos clásicos de elección satisfacen dos tipos racionales de principios de elección. Un principio se llama independencia de alternativas irrelevantes., y de acuerdo con este principio, si la probabilidad de elegir la opción X es mayor que la opción Y cuando solo X, Y están disponibles, entonces la opción X debería seguir siendo más probable que se elija sobre Y incluso cuando se agregue una nueva opción Z a la elección colocar. En otras palabras, agregar una opción no debería cambiar la relación de preferencia entre el par de opciones original. Un segundo principio se llama regularidad, y de acuerdo con este principio, la probabilidad de elegir la opción X de un conjunto que contenga solo X e Y debe ser mayor o igual que la probabilidad de elegir la opción X de un conjunto más grande que contenga las opciones X, Y, y una nueva opción Z. En otras palabras, agregar una opción solo debería disminuir la probabilidad de elegir una de las dos opciones originales. Sin embargo,Los hallazgos empíricos obtenidos por los investigadores de consumidores que estudian la conducta de elección humana han encontrado efectos de contexto sistemáticos que violan sistemáticamente ambos principios.

El primer efecto de contexto es el efecto de similitud. Este efecto ocurre con la introducción de una tercera opción S que es similar a X pero no está dominada por X. Por ejemplo, supongamos que X es un BMW, Y es un Ford Focus y S es un Audi. El Audi es similar al BMW porque ambos no son muy económicos pero son de alta calidad y deportivos. El Ford Focus es diferente del BMW y Audi porque es más económico pero de menor calidad. Suponga que en una elección binaria, X se elige con más frecuencia que Y. A continuación, suponga que se forma un nuevo conjunto de opciones agregando una opción S que es similar a X. Si X es similar a S, y ambas son muy diferentes de Y, las personas tienden a ver X y S como un grupo e Y como otra opción. Por tanto, la probabilidad de Y sigue siendo la misma tanto si S se presenta como una opción como si no. Sin embargo,la probabilidad de X disminuirá aproximadamente a la mitad con la introducción de S. Esto hace que la probabilidad de elegir X caiga por debajo de Y cuando S se agrega al conjunto de opciones. Esto viola la independencia de la propiedad de alternativas irrelevantes porque en una elección binaria, X se elige con más frecuencia que Y, pero cuando se agrega S, entonces Y se elige con más frecuencia que X.

El segundo efecto de contexto es el efecto de compromiso. Este efecto se produce cuando se agrega una opción C que es un compromiso entre X e Y. Por ejemplo, al elegir entre C = Honda y X = BMW, esta última es menos económica pero de mayor calidad. Sin embargo, si se agrega otra opción Y = Ford Focus al conjunto de opciones, entonces C = Honda se convierte en un compromiso entre X = BMW e Y = Ford Focus. Supongamos que en una elección binaria, X (BMW) se elige con más frecuencia que C (Honda). Pero cuando se agrega la opción Y (Ford Focus) al conjunto de opciones, la opción C (Honda) se convierte en el compromiso entre X (BMW) e Y (Ford Focus), y C se elige con más frecuencia que X. Esta es otra violación de la propiedad de independencia de las alternativas irrelevantes porque X se elige con más frecuencia que C en una opción binaria, pero C cuando se agrega la opción Y al conjunto de opciones,entonces C se elige con más frecuencia que X.

El tercer efecto se llama efecto de atracción. Este efecto ocurre cuando la tercera opción D es muy similar a X pero D está defectuosa en comparación con X. Por ejemplo, D puede ser un nuevo automóvil deportivo desarrollado por un nuevo fabricante que es similar a la opción X = BMW, pero cuesta más que el BMW. . Por lo tanto, hay poca o ninguna razón para elegir D en lugar de X, y en esta situación rara vez se elige D sobre X. Sin embargo, agregar D a un conjunto de opciones aumenta la probabilidad de elegir X. En particular, la probabilidad de elegir X de un conjunto que contiene X, Y, D es mayor que la probabilidad de elegir X de un conjunto que contiene solo X e Y. La opción defectuosa D hace que X brille, y este efecto de atracción viola el principio de regularidad, que dice que agregar otra opción no puede aumentar la popularidad de una opción sobre el subconjunto original.

DFT tiene en cuenta los tres efectos utilizando los mismos principios y los mismos parámetros en los tres hallazgos. Según DFT, el mecanismo de cambio de atención es crucial para producir el efecto de similitud, pero las conexiones inhibitorias laterales son críticas para explicar los efectos de compromiso y atracción. Si se elimina el proceso de cambio de atención, el efecto de similitud desaparece, y si las conexiones laterales se establecen en cero, los efectos de atracción y compromiso desaparecen. Esta propiedad de la teoría conlleva una interesante predicción sobre los efectos de la presión del tiempo sobre las preferencias. Los efectos de contraste producidos por la inhibición lateral requieren tiempo para acumularse, lo que implica que los efectos de atracción y compromiso deberían aumentar bajo una deliberación prolongada (verRoe, Busemeyer y Townsend 2001 ). Alternativamente, si los efectos de contexto se producen al cambiar de una regla de promedio ponderado bajo una opción binaria a una estrategia heurística rápida para la elección triádica, entonces estos efectos deberían agrandarse bajo la presión del tiempo. Las pruebas empíricas muestran que prolongar el proceso de decisión aumenta los efectos [18] [19] y la presión del tiempo disminuye los efectos. [20]

Neurociencia

La teoría del campo de decisión ha demostrado la capacidad de dar cuenta de una amplia gama de hallazgos de la toma de decisiones conductuales que los modelos puramente algebraicos y deterministas que se utilizan a menudo en economía y psicología no pueden explicar. Estudios recientes que registran activaciones neuronales en primates no humanos durante las tareas de toma de decisiones perceptivas han revelado que las tasas de activación neuronal imitan de cerca la acumulación de preferencias teorizadas por modelos de difusión de toma de decisiones derivados del comportamiento. [8]

Los procesos de decisión de las decisiones sensorio-motoras están comenzando a entenderse bastante bien tanto a nivel conductual como neuronal. Los hallazgos típicos indican que la activación neuronal con respecto a la información del movimiento del estímulo se acumula a lo largo del tiempo hasta un umbral, y se produce una respuesta conductual tan pronto como la activación en el área registrada supera el umbral. [21] [22] [23] [24] [25] Una conclusión que se puede extraer es que las áreas neuronales encargadas de planificar o ejecutar determinadas acciones son también las encargadas de decidir la acción a realizar, una noción decididamente incorporada. [8]

Matemáticamente, el patrón de activación de picos, así como las distribuciones de tiempo de elección y respuesta, pueden describirse bien mediante lo que se conoce como modelos de difusión, especialmente en tareas de elección forzada de dos alternativas . [26] Los modelos de difusión, como la teoría del campo de decisión, pueden verse como modelos estocásticos de redes neuronales recurrentes, excepto que las dinámicas se aproximan mediante sistemas lineales. La aproximación lineal es importante para mantener un análisis matemáticamente manejable de sistemas perturbados por entradas ruidosas. Además de estas aplicaciones de la neurociencia, los científicos cognitivos han utilizado modelos de difusión (o su tiempo discreto, caminata aleatoria, análogos) para modelar el desempeño en una variedad de tareas que van desde la detección sensorial, [13]y discriminación perceptiva, [11] [12] [14] al reconocimiento de la memoria, [15] y categorización. [9] [10] Por lo tanto, los modelos de difusión brindan el potencial para formar un puente teórico entre los modelos neuronales de tareas sensorial-motoras y los modelos conductuales de tareas cognitivas complejas. [8]

Notas

  1. ^ Busemeyer, JR y Townsend, JT (1993) Teoría del campo de decisión: un enfoque cognitivo dinámico para la toma de decisiones . Psychological Review, 100, 432–459.
  2. ^ Busemeyer, JR y Diederich, A. (2002). Estudio de la teoría del campo de decisión. Ciencias Sociales Matemáticas, 43 (3), 345-370.
  3. ^ Busemeyer, JR y Johnson, JG (2004). Modelos computacionales de toma de decisiones. Manual de juicio y toma de decisiones de Blackwell, 133-154.
  4. ↑ a b c d e f Busemeyer, JR y Johnson, JG (2008). Modelos de microprocesos de toma de decisiones. Manual de Cambridge de psicología computacional, 302-321.
  5. ^ Oliveira, IFD; Zehavi, S .; Davidov, O. (agosto de 2018). "Transitividad estocástica: axiomas y modelos". Revista de Psicología Matemática . 85 : 25–35. doi : 10.1016 / j.jmp.2018.06.002 . ISSN  0022-2496 .
  6. ^ Regenwetter, Michel; Dana, Jason; Davis-Stober, Clintin P. (2011). "Transitividad de las preferencias". Revisión psicológica . 118 (1): 42–56. doi : 10.1037 / a0021150 . ISSN 1939-1471 . PMID 21244185 .  
  7. ^ Tversky, Amos (1969). "Intransitividad de preferencias". Revisión psicológica . 76 (1): 31–48. doi : 10.1037 / h0026750 . ISSN 0033-295X . 
  8. ^ a b c d Busemeyer, JR; Jessup, RK; Johnson, JG; Townsend, JT (2006). "Construyendo puentes entre modelos neuronales y conductas de toma de decisiones complejas". Redes neuronales . 19 (8): 1047–1058. doi : 10.1016 / j.neunet.2006.05.043 . PMID 16979319 . 
  9. ↑ a b Ashby, FG (2000). "Una versión estocástica de la teoría del reconocimiento general". Revista de Psicología Matemática . 44 (2): 310–329. doi : 10.1006 / jmps.1998.1249 . PMID 10831374 . 
  10. ↑ a b Nosofsky, RM; Palmeri, TJ (1997). "Un modelo de paseo aleatorio basado en ejemplos de clasificación acelerada". Revisión psicológica . 104 (2): 226–300. doi : 10.1037 / 0033-295X.104.2.266 . PMID 9127583 . 
  11. ↑ a b Laming, DR (1968). Teoría de la información de los tiempos de elección-reacción . Nueva York: Academic Press. OCLC 425332 . 
  12. ^ a b Enlace, SW; Heath, RA (1975). "Una teoría secuencial de la discriminación psicológica". Psychometrika . 40 : 77-111. doi : 10.1007 / BF02291481 . S2CID 49042143 . 
  13. ↑ a b Smith, PL (1995). "Modelos de principios psicofísicos de tiempo de reacción visual simple". Revisión psicológica . 102 (3): 567–593. doi : 10.1037 / 0033-295X.102.3.567 .
  14. ^ a b Usher, M .; McClelland, JL (2001). "El curso del tiempo de la elección perceptiva: el modelo acumulador competitivo con fugas". Revisión psicológica . 108 (3): 550–592. doi : 10.1037 / 0033-295X.108.3.550 . PMID 11488378 . 
  15. ↑ a b Ratcliff, R. (1978). "Una teoría de la recuperación de la memoria". Revisión psicológica . 85 (2): 59–108. doi : 10.1037 / 0033-295X.85.2.59 .
  16. ^ Diederich, A. (2003). "Cuenta MDFT de la toma de decisiones bajo presión de tiempo" . Boletín y Revista Psiconómica . 10 (1): 157-166. doi : 10.3758 / BF03196480 . PMID 12747503 . 
  17. ^ Roe, RM; Busemeyer, JR; Townsend, JT (2001). "Teoría del campo de decisión de múltiples alternativas: un modelo conexionista dinámico de toma de decisiones". Revisión psicológica . 108 (2): 370–392. doi : 10.1037 / 0033-295X.108.2.370 . PMID 11381834 . 
  18. ^ Pettibone, JC (2012). "Probar el efecto de la presión del tiempo sobre el dominio asimétrico y los señuelos de compromiso en la elección" (PDF) . Juicio y toma de decisiones . 7 (4): 513–523.
  19. ^ Simonson, I. (1989). "Elección basada en razones: el caso de los efectos de atracción y compromiso". Revista de investigación del consumidor . 16 (2): 158-174. doi : 10.1086 / 209205 .
  20. ^ Dhar, R .; Nowlis, SM; Sherman, SJ (2000). "Esforzarse o apenas esforzarse: un análisis de los efectos del contexto en la elección". Revista de psicología del consumidor . 9 (4): 189-200. doi : 10.1207 / S15327663JCP0904_1 .
  21. ^ Schall, JD (2003). "Correlatos neuronales de los procesos de decisión: cronometría neuronal y mental". Opinión actual en neurobiología . 13 (2): 182–186. doi : 10.1016 / S0959-4388 (03) 00039-4 . PMID 12744971 . S2CID 2816799 .  
  22. ^ Oro, JI; Shadlen, MN (2000). "Representación de una decisión perceptual en el desarrollo de comandos oculomotores". Naturaleza . 404 (6776): 390–394. Código Bibliográfico : 2000Natur.404..390G . doi : 10.1038 / 35006062 . PMID 10746726 . S2CID 4410921 .  
  23. ^ Mazurek, YO; Roitman, JD; Ditterich, J .; Shadlen, MN (2003). "Un papel de los integradores neuronales en la toma de decisiones perceptuales" . Corteza cerebral . 13 (11): 1257–1269. doi : 10.1093 / cercor / bhg097 . PMID 14576217 . 
  24. Ratcliff, R .; Cherian, A .; Segraves, M. (2003). "Una comparación del comportamiento de los macacos y la actividad neuronal del colículo superior con las predicciones de los modelos de decisiones de dos opciones". Revista de neurofisiología . 90 (3): 1392–1407. doi : 10.1152 / jn.01049.2002 . PMID 12761282 . 
  25. ^ Shadlen, MN; Newsome, WT (2001). "Base neural de una decisión perceptiva en la corteza parietal (área LIP) del mono rhesus". Revista de neurofisiología . 86 (4): 1916-1936. doi : 10.1152 / jn.2001.86.4.1916 . PMID 11600651 . 
  26. ^ Para un resumen, vea Smith, PL; Ratcliff, R. (2004). "Psicología y neurobiología de decisiones simples". Tendencias en neurociencias . 27 (3): 161–168. doi : 10.1016 / j.tins.2004.01.006 . PMID 15036882 . S2CID 6182265 .  

Referencias

  • Busemeyer, JR; Diederich, A. (2002). "Estudio de la teoría del campo de decisión" (PDF) . Ciencias Sociales Matemáticas . 43 (3): 345–370. doi : 10.1016 / S0165-4896 (02) 00016-1 .
  • Busemeyer, JR; Johnson, JJ (2004). "Modelos computacionales de toma de decisiones" (PDF) . En Koehler, D .; Harvey, N. (eds.). Manual de Juicio y Toma de Decisiones . Blackwell. págs. 133-154.
  • Busemeyer, JR; Johnson, JJ (2008). "Modelos de microprocesos de toma de decisiones" (PDF) . En Sun, R. (ed.). Manual de Cambridge de modelado cognitivo computacional . Prensa de la Universidad de Cambridge.
Obtenido de " https://en.wikipedia.org/w/index.php?title=Decision_field_theory&oldid=1006251559 "