De Wikipedia, la enciclopedia libre
  (Redirigido desde Refuerzo positivo )
Saltar a navegación Saltar a búsqueda

Usar una caja de Skinner para alterar el comportamiento de la rata en cuestión

En psicología del comportamiento , el refuerzo es una consecuencia aplicada que fortalecerá el comportamiento futuro de un organismo siempre que ese comportamiento esté precedido por un estímulo antecedente específico.. Este efecto de fortalecimiento puede medirse como una mayor frecuencia de comportamiento (p. Ej., Tirar de una palanca con más frecuencia), mayor duración (p. Ej., Tirar de una palanca durante períodos de tiempo más largos), mayor magnitud (p. Ej., Tirar de una palanca con mayor fuerza), o latencia más corta (p. ej., tirar de una palanca más rápidamente siguiendo el estímulo antecedente). Hay dos tipos de refuerzo, conocidos como refuerzo positivo y refuerzo negativo; positivo es mediante el cual se ofrece una recompensa por la expresión del comportamiento deseado y negativo es quitar un elemento indeseable en el entorno de la persona cada vez que se logra el comportamiento deseado. Los estímulos gratificantes , que están asociados con "querer" y "gustar" (deseo y placer, respectivamente) y la conducta apetitiva, funcionan comoreforzadores positivos ; [1] la afirmación inversa también es cierta: los reforzadores positivos proporcionan un estímulo deseable. [1] El refuerzo no requiere que un individuo perciba conscientemente un efecto provocado por el estímulo. [2] Por lo tanto, el refuerzo ocurre solo si hay un fortalecimiento observable en la conducta. Sin embargo, también existe el refuerzo negativo, que se caracteriza por quitar un estímulo indeseable. Cambiar el trabajo de alguien puede servir como un refuerzo negativo para alguien que sufre de problemas de espalda, es decir, cambiar de un trabajo de trabajador a un puesto de oficina, por ejemplo.

En la mayoría de los casos, el término "refuerzo" se refiere a una mejora de la conducta, pero este término también se utiliza a veces para denotar una mejora de la memoria; por ejemplo, "refuerzo posterior al entrenamiento" se refiere a la provisión de un estímulo (como comida) después de una sesión de aprendizaje en un intento de aumentar la amplitud, el detalle y la duración retenidos de los recuerdos individuales o la memoria general recién formada. [3] El estímulo que mejora la memoria también puede ser uno cuyos efectos sean directamente emocionales en lugar de solo indirectamente, como ocurre con el fenómeno de " memoria flash, "en el que un estímulo emocionalmente muy intenso puede incentivar la memoria de un conjunto de circunstancias de una situación mucho más allá del subconjunto de aquellas circunstancias que causaron el estímulo emocionalmente significativo, como cuando las personas de la edad apropiada son capaces de recordar dónde estaban y qué eran haciendo cuando se enteraron del asesinato de John F. Kennedy o de los 11 de septiembre de 2001, los ataques terroristas . [4]

El refuerzo es una parte importante del condicionamiento operante o instrumental .

Terminología [ editar ]

En las ciencias del comportamiento, los términos "positivo" y "negativo" se refieren cuando se usan en su sentido técnico estricto a la naturaleza de la acción realizada por el condicionador más que a la evaluación de la operante que responde de esa acción y su (s) consecuencia (s). Las acciones "positivas" son aquellas que agregan un factor, ya sea agradable o desagradable, al ambiente, mientras que las acciones "negativas" son aquellas que eliminan o retienen del ambiente un factor de cualquier tipo. A su vez, el sentido estricto de "refuerzo" se refiere únicamente al condicionamiento basado en recompensas; la introducción de factores desagradables y la eliminación o retención de factores agradables se denominan en cambio "castigo", que cuando se usa en su sentido estricto, por lo tanto, contrasta con el "refuerzo". Por lo tanto, "refuerzo positivo "se refiere a la adición de un factor agradable," castigo positivo "se refiere a la adición de un factor desagradable," refuerzo negativo "se refiere a la eliminación o retención de un factor desagradable y" castigo negativo "se refiere a la eliminación o retención de un factor agradable.

Este uso está en desacuerdo con algunos usos no técnicos de las cuatro combinaciones de términos, especialmente en el caso del término "refuerzo negativo", que a menudo se usa para denotar lo que el lenguaje técnico describiría como "castigo positivo" en el sentido de que el término no El uso técnico interpreta "refuerzo" como que incluye tanto la recompensa como el castigo y "negativo" como una referencia a la evaluación de la operante que responde del factor que se está introduciendo. Por el contrario, el lenguaje técnico usaría el término "refuerzo negativo" para describir el estímulo de un comportamiento dado mediante la creación de un escenario en el que un factor desagradable está o estará presente, pero participar en el comportamiento da como resultado escapar de ese factor o prevenir su ocurrencia. , como en Martin Seligman 'sexperimentos que involucran los procesos de aprendizaje de los perros para evitar descargas eléctricas .

Introducción [ editar ]

BF Skinner fue un investigador conocido e influyente que articuló muchos de los constructos teóricos del reforzamiento y el conductismo.. Skinner definió los reforzadores de acuerdo con el cambio en la fuerza de respuesta (tasa de respuesta) en lugar de criterios más subjetivos, como lo que es placentero o valioso para alguien. En consecuencia, las actividades, los alimentos o los elementos que se consideran agradables o placenteros pueden no necesariamente ser reforzadores (porque no producen un aumento en la respuesta que los precede). Los estímulos, entornos y actividades solo se ajustan a la definición de reforzadores si el comportamiento que precede inmediatamente al reforzador potencial aumenta en situaciones similares en el futuro; por ejemplo, un niño que recibe una galleta cuando la pide. Si aumenta la frecuencia del "comportamiento de solicitud de cookies", se puede considerar que la cookie refuerza el "comportamiento de solicitud de cookies". Sin embargo, si "comportamiento de solicitud de cookies"no aumenta la cookie no puede considerarse un refuerzo.

El único criterio que determina si un estímulo es reforzante es el cambio en la probabilidad de un comportamiento después de la administración de ese reforzador potencial. Otras teorías pueden centrarse en factores adicionales, como si la persona esperaba que un comportamiento produjera un resultado determinado, pero en la teoría del comportamiento, el refuerzo se define por una mayor probabilidad de respuesta.

El estudio del refuerzo ha producido una enorme cantidad de resultados experimentales reproducibles . El refuerzo es el concepto y el procedimiento central en la educación especial , el análisis de conducta aplicado y el análisis experimental de la conducta y es un concepto central en algunos modelos médicos y psicofarmacológicos , en particular la adicción , la dependencia y la compulsión .

Breve historia [ editar ]

La investigación de laboratorio sobre el refuerzo suele estar fechada por el trabajo de Edward Thorndike , conocido por sus experimentos con gatos que escapan de cajas de rompecabezas. [9] Varios otros continuaron esta investigación, en particular BF Skinner, quien publicó su trabajo fundamental sobre el tema en The Behavior of Organisms, en 1938, y elaboró ​​esta investigación en muchas publicaciones posteriores. [10] En particular, Skinner argumentó que el refuerzo positivo es superior al castigo en la configuración del comportamiento. [11] Aunque el castigo puede parecer exactamente lo opuesto al refuerzo, Skinner afirmó que difieren enormemente, diciendo que el refuerzo positivo da como resultado una modificación duradera del comportamiento.(a largo plazo) mientras que el castigo cambia el comportamiento solo temporalmente (a corto plazo) y tiene muchos efectos secundarios perjudiciales. Posteriormente, muchos investigadores ampliaron nuestra comprensión del refuerzo y desafiaron algunas de las conclusiones de Skinner. Por ejemplo, Azrin y Holz definieron el castigo como una "consecuencia de la conducta que reduce la probabilidad futura de esa conducta", [12] y algunos estudios han demostrado que el refuerzo positivo y el castigo son igualmente efectivos para modificar la conducta. La investigación sobre los efectos del refuerzo positivo, el refuerzo negativo y el castigo continúan hoy en día, ya que esos conceptos son fundamentales para aprender la teoría y se aplican a muchas aplicaciones prácticas de esa teoría.

Acondicionamiento operante [ editar ]

El término condicionamiento operante fue introducido por BF Skinner para indicar que en su paradigma experimental el organismo es libre de operar en el medio ambiente. En este paradigma, el experimentador no puede desencadenar la respuesta deseable; el experimentador espera a que se produzca la respuesta (a ser emitida por el organismo) y luego se entrega un reforzador potencial. En el paradigma de condicionamiento clásico, el experimentador desencadena (provoca) la respuesta deseable al presentar un estímulo que provoca reflejo, el Estímulo Incondicional (UCS), que empareja (precede) con un estímulo neutral, el Estímulo Condicional (CS).

El refuerzo es un término básico en el condicionamiento operante. Para el aspecto de castigo del condicionamiento operante, ver castigo (psicología) .

Refuerzo positivo [ editar ]

El refuerzo positivo ocurre cuando un evento o estímulo deseable se presenta como consecuencia de un comportamiento y aumenta la posibilidad de que este comportamiento se manifieste en entornos similares. [13] : 253

  • Ejemplo: cada vez que una rata presiona un botón, recibe una golosina. Si la rata comienza a presionar el botón con más frecuencia, la golosina sirve para reforzar positivamente este comportamiento.
  • Ejemplo: un padre le da dulces a su hija cuando ella ordena sus juguetes. Si aumenta la frecuencia de recoger los juguetes, el caramelo es un reforzador positivo (para reforzar el comportamiento de limpieza).
  • Ejemplo: una empresa promulga un programa de recompensas en el que los empleados ganan premios en función de la cantidad de artículos vendidos. Los premios que reciben los empleados son el refuerzo positivo si aumentan las ventas.
  • Ejemplo: un maestro elogia a su alumno cuando recibe una buena calificación. El elogio que recibe el estudiante es el refuerzo positivo en caso de que las calificaciones del estudiante mejoren.
  • Ejemplo: un supervisor otorga una recompensa monetaria al empleado que más supera las expectativas. La recompensa monetaria es el refuerzo positivo del buen comportamiento: superar las expectativas.

El tratamiento de Instrucción de Alta Probabilidad (HPI) es un tratamiento psicológico conductista basado en la idea de refuerzo positivo.

Refuerzo negativo [ editar ]

El refuerzo negativo ocurre cuando la tasa de un comportamiento aumenta porque se elimina o se evita que suceda un evento o estímulo aversivo . [13] : 253

  • Ejemplo: un niño limpia su habitación, y este comportamiento es seguido cuando el padre deja de "regañar" o pide al niño repetidamente que lo haga. Aquí, el regaño sirve para reforzar negativamente la conducta de limpieza porque el niño quiere quitar ese estímulo aversivo del regaño.
  • Ejemplo: una empresa tiene una política de que si un empleado completa su trabajo asignado antes del viernes, puede tener el sábado libre. Trabajar el sábado es el estímulo aversivo; los empleados tienen incentivo para aumentar la productividad para evitar el estímulo aversivo.
  • Ejemplo: una persona se va temprano al trabajo para evitar el tráfico y evitar llegar tarde. El comportamiento es irse temprano al trabajo y el estímulo aversivo que el individuo desea eliminar es llegar tarde al trabajo.

Extinción [ editar ]

La extinción puede ser intencionada o no y ocurre cuando se ignora un comportamiento no deseado.

  • Ejemplo (previsto): un niño ignora a los matones que se burlan de él. Los acosadores no obtienen una reacción del niño y pierden interés en acosarlo.
  • Ejemplo (involuntario): un trabajador no ha recibido ningún reconocimiento por su trabajo duro y más allá. Luego deja de trabajar tan duro.
  • Ejemplo (previsto): un gato seguía maullando en busca de comida durante la noche. Los dueños no le daban de comer al gato, por lo que el gato dejó de maullar durante la noche.

Refuerzo versus castigo [ editar ]

Los reforzadores sirven para aumentar los comportamientos mientras que los castigadores sirven para disminuir los comportamientos; así, los reforzadores positivos son estímulos que el sujeto trabajará para alcanzar, y los reforzadores negativos son estímulos que el sujeto trabajará para deshacerse o terminar. [14] La siguiente tabla ilustra la suma y la resta de estímulos (agradables o aversivos) en relación con el refuerzo frente al castigo.

Por ejemplo, ofrecerle dulces a un niño si limpia su habitación es un refuerzo positivo. Azotar a un niño si rompe una ventana es un castigo positivo. Quitarle los juguetes a un niño por portarse mal es un castigo negativo. Darle a un niño un descanso de sus quehaceres si se desempeña bien en una prueba es un refuerzo negativo. "Positivo y negativo" no tiene el significado de "bueno y malo" en este uso.

Más ideas y conceptos [ editar ]

  • Distinguir entre positivo y negativo puede ser difícil y no siempre es necesario; centrarse en lo que se está quitando o agregando y cómo se está quitando o agregando determinará la naturaleza del refuerzo.
  • El refuerzo negativo no es un castigo. Los dos, como se explicó anteriormente, se diferencian en el aumento (refuerzo negativo) o disminución (castigo) de la probabilidad futura de una respuesta. En el refuerzo negativo, el estímulo eliminado después de una respuesta es un estímulo aversivo; si este estímulo se presentó en función de una respuesta, también puede funcionar como un castigo positivo.
  • La forma de un estímulo es independiente de su función en términos de si reforzará o castigará la conducta. Un evento que puede castigar el comportamiento de algunos puede servir para reforzar el comportamiento de otros. Ejemplo: un niño es castigado repetidamente por comportarse mal en la escuela, pero la frecuencia del mal comportamiento aumenta. Por tanto, la detención puede ser un reforzador (puede ser positivo o negativo); tal vez el niño ahora reciba atención personalizada de un maestro o tal vez ahora evite ir a casa donde a menudo se abusa de él.
  • Algunos refuerzos pueden ser simultáneamente positivos y negativos, como un drogadicto que toma drogas para la euforia adicional (un sentimiento positivo) y la eliminación de los síntomas de abstinencia (que sería un sentimiento negativo). O, en una habitación cálida, una corriente de aire exterior sirve como refuerzo positivo porque es agradablemente fresco y como refuerzo negativo porque elimina el incómodo aire caliente.
  • El refuerzo en el mundo empresarial es fundamental para impulsar la productividad. Los empleados están constantemente motivados por la capacidad de recibir un estímulo positivo, como una promoción o un bono. Los empleados también se ven impulsados ​​por el refuerzo negativo. Esto se puede ver cuando se ofrece a los empleados los sábados libres si completan la carga de trabajo semanal antes del viernes.
  • Aunque el refuerzo negativo tiene un efecto positivo a corto plazo para un lugar de trabajo (es decir, fomenta una acción económicamente beneficiosa), la dependencia excesiva de un refuerzo negativo obstaculiza la capacidad de los trabajadores para actuar de forma creativa y comprometida creando crecimiento a largo plazo. [15]
  • Tanto el refuerzo positivo como el negativo aumentan la conducta. La mayoría de las personas, especialmente los niños, aprenderán a seguir las instrucciones mediante una combinación de refuerzos positivos y negativos. [13]
  • Los recursos limitados pueden hacer que una persona no pueda proporcionar un refuerzo constante.

Refuerzos primarios [ editar ]

Un reforzador primario , a veces llamado reforzador incondicionado , es un estímulo que no requiere emparejamiento con un estímulo diferente para funcionar como reforzador y muy probablemente ha obtenido esta función a través de la evolución y su papel en la supervivencia de las especies. [dieciséis]Ejemplos de reforzadores primarios incluyen comida, agua y sexo. Algunos reforzadores primarios, como ciertos fármacos, pueden imitar los efectos de otros reforzadores primarios. Si bien estos reforzadores primarios son bastante estables a lo largo de la vida y entre individuos, el valor de reforzamiento de diferentes reforzadores primarios varía debido a múltiples factores (p. Ej., Genética, experiencia). Por lo tanto, una persona puede preferir un tipo de comida mientras que otra lo evita. O una persona puede comer mucha comida mientras que otra come muy poco. Entonces, aunque la comida es un reforzador principal para ambos individuos, el valor de la comida como reforzador difiere entre ellos.

Reforzadores secundarios[ editar ]

Un reforzador secundario , a veces llamado reforzador condicionado , es un estímulo o situación que ha adquirido su función como reforzador después de emparejarse con un estímulo que funciona como reforzador. Este estímulo puede ser un reforzador primario u otro reforzador condicionado (como el dinero). Un ejemplo de reforzador secundario sería el sonido de un clicker, como se usa en el entrenamiento del clicker . El sonido del clicker se ha asociado con elogios o golosinas y, posteriormente, el sonido del clicker puede funcionar como reforzador. Otro ejemplo común es el sonido de la gente aplaudiendo; no hay nada intrínsecamente positivo en escuchar ese sonido, pero hemos aprendido que está asociado con elogios y recompensas.

Cuando intente distinguir reforzadores primarios y secundarios en ejemplos humanos, utilice la "prueba del hombre de las cavernas". Si el estímulo es algo que un hombre de las cavernas naturalmente encontraría deseable (por ejemplo, un caramelo), entonces es un reforzador principal. Si, por otro lado, el hombre de las cavernas no reacciona (por ejemplo, un billete de un dólar), es un reforzador secundario. Al igual que con los reforzadores primarios, un organismo puede experimentar saciedad y privación con reforzadores secundarios.

Otros términos de refuerzo [ editar ]

  • Un reforzador generalizado es un reforzador condicionado que ha obtenido la función reforzante al emparejarse con muchos otros reforzadores y funciona como reforzador bajo una amplia variedad de operaciones de motivación . (Un ejemplo de esto es el dinero porque se combina con muchos otros reforzadores). [17] : 83
  • En el muestreo de reforzadores, un estímulo potencialmente reforzante pero desconocido se presenta a un organismo sin tener en cuenta ningún comportamiento previo.
  • El refuerzo mediado socialmente (refuerzo directo) implica la entrega de refuerzo que requiere el comportamiento de otro organismo.
  • El principio de Premack es un caso especial de refuerzo elaborado por David Premack , que establece que una actividad muy preferida se puede utilizar eficazmente como reforzador de una actividad menos preferida. [17] : 123
  • La jerarquía de reforzamiento es una lista de acciones, ordenando las consecuencias más deseables a las menos deseables que pueden servir como reforzador. Se puede utilizar una jerarquía de reforzamiento para determinar la frecuencia relativa y la conveniencia de diferentes actividades, y a menudo se emplea cuando se aplica el principio de Premack. [ cita requerida ]
  • Es más probable que los resultados contingentes refuercen el comportamiento que las respuestas no contingentes. Los resultados contingentes son aquellos directamente vinculados a un comportamiento causal , como el encendido de la luz depende de que se active un interruptor. Tenga en cuenta que los resultados contingentes no son necesarios para demostrar el refuerzo, pero la contingencia percibida puede aumentar el aprendizaje.
  • Los estímulos contiguos son estímulos estrechamente asociados por el tiempo y el espacio con comportamientos específicos. Reducen la cantidad de tiempo necesario para aprender un comportamiento al tiempo que aumentan su resistencia a la extinción . Darle a un perro un trozo de comida inmediatamente después de sentarse es más contiguo con (y por lo tanto, es más probable que refuerce) el comportamiento que un retraso de varios minutos en la entrega de alimentos después del comportamiento.
  • El refuerzo no contingente se refiere a la entrega de estímulos independientes de la respuesta identificados como reforzadores de algunos comportamientos de ese organismo. Sin embargo, esto típicamente implica la entrega de estímulos basados ​​en el tiempo identificados como mantenimiento de una conducta aberrante, lo que disminuye la tasa de la conducta objetivo. [18] Como ningún comportamiento medido se identifica como reforzado, existe controversia en torno al uso del término "refuerzo" no contingente. [19]

Natural y artificial [ editar ]

En su artículo de 1967, Arbitrary and Natural Reinforcement , Charles Ferster propuso clasificar el reforzamiento en eventos que aumentan la frecuencia de una operante como una consecuencia natural de la conducta en sí, y eventos que se presume que afectan la frecuencia por su requerimiento de mediación humana, como en una economía de fichas en la que los sujetos son "recompensados" por cierto comportamiento con una ficha arbitraria de un valor negociable.

En 1970, Baer y Wolf crearon un nombre para el uso de reforzadores naturales llamados "trampas de comportamiento". [20] Una trampa de comportamiento requiere solo una respuesta simple para entrar en la trampa, sin embargo, una vez que se entra, no se puede resistir la trampa para crear un cambio de comportamiento general. Es el uso de una trampa conductual lo que aumenta el repertorio de una persona, exponiéndola al refuerzo natural de esa conducta. Las trampas de comportamiento tienen cuatro características:

  • Son "cebados" con reforzadores virtualmente irresistibles que "atraen" al estudiante a la trampa.
  • Solo una respuesta de bajo esfuerzo que ya está en el repertorio es necesaria para entrar en la trampa.
  • Las contingencias interrelacionadas de refuerzo dentro de la trampa motivan a la persona a adquirir, ampliar y mantener las habilidades académicas / sociales específicas [21].
  • Pueden permanecer efectivos durante largos períodos de tiempo porque la persona muestra pocos o ningún efecto de saciedad.

Como se puede ver en lo anterior, el refuerzo artificial se crea de hecho para construir o desarrollar habilidades, y para generalizar, es importante que se introduzca una trampa de comportamiento para "capturar" la habilidad y utilizar el refuerzo natural para mantenerla o aumentarla. . Esta trampa de comportamiento puede ser simplemente una situación social que generalmente resultará de un comportamiento específico una vez que haya cumplido con un cierto criterio (por ejemplo, si usa reforzadores comestibles para entrenar a una persona a saludar y sonreír a la gente cuando la conoce, después de eso). se ha desarrollado la habilidad, el reforzador natural de la sonrisa de otras personas, y tener interacciones más amistosas reforzará naturalmente la habilidad y los comestibles se pueden desvanecer). [ cita requerida ]

Programas de refuerzo intermitentes [ editar ]

Gran parte del comportamiento no se refuerza cada vez que se emite, y el patrón de refuerzo intermitente afecta fuertemente la rapidez con que se aprende una respuesta operante, cuál es su frecuencia en un momento dado y cuánto tiempo continúa cuando cesa el refuerzo. Las reglas más simples que controlan el refuerzo son el refuerzo continuo, donde se refuerza cada respuesta, y la extinción, donde no se refuerza ninguna respuesta. Entre estos extremos, los "programas de reforzamiento" más complejos especifican las reglas que determinan cómo y cuándo un reforzador seguirá una respuesta.

Los programas específicos de refuerzo inducen de manera confiable patrones específicos de respuesta, independientemente de la especie que se esté investigando (incluidos los humanos en algunas condiciones). Sin embargo, las propiedades cuantitativas del comportamiento bajo un programa determinado dependen de los parámetros del programa y, a veces, de otros factores ajenos al programa. El orden y la previsibilidad de la conducta bajo programas de reforzamiento fue evidencia de la afirmación de BF Skinner de que al usar el condicionamiento operante podía obtener "control sobre la conducta", de una manera que volvía obsoletas las disputas teóricas de la psicología comparada contemporánea . La confiabilidad del control del horario apoyó la idea de que un análisis experimental conductista radical de la conductapodría ser la base de una psicología que no se refiera a procesos mentales o cognitivos. La confiabilidad de los horarios también condujo al desarrollo del análisis de comportamiento aplicado como un medio para controlar o alterar el comportamiento.

Muchas de las posibilidades más simples, y algunas de las más complejas, fueron investigadas en profundidad por Skinner utilizando palomas , pero se siguen definiendo e investigando nuevos horarios.

Horarios simples [ editar ]

Un gráfico que demuestra la diferente tasa de respuesta de los cuatro programas simples de refuerzo, cada marca de trama designa un refuerzo que se está dando.
  • Programa de proporciones : el refuerzo depende solo del número de respuestas que ha realizado el organismo.
  • Refuerzo continuo (CRF) : un programa de refuerzo en el que cada ocurrencia de la respuesta instrumental (respuesta deseada) es seguida por el reforzador. [17] : 86
    • Ejemplo de laboratorio: cada vez que una rata presiona una barra, obtiene una bolita de comida.
    • Ejemplo del mundo real: cada vez que un perro defeca fuera, su dueño le da una golosina; cada vez que una persona pone $ 1 en una máquina de dulces y presiona los botones, recibe una barra de chocolate.

Los horarios simples tienen una sola regla para determinar cuándo se entrega un solo tipo de reforzador para una respuesta específica.

  • Proporción fija (FR) - horarios entregan refuerzo después de cada n º respuesta. [17] : 88 Un horario FR 1 es sinónimo de un horario CRF.
    • Ejemplo: FR 2 = se refuerza cada segundo de la respuesta deseada que hace el sujeto.
    • Ejemplo de laboratorio: FR 5 = el comportamiento de la rata al presionar la barra se refuerza con comida después de cada 5 presiones de barra en una caja Skinner .
    • Ejemplo del mundo real: FR 10 = El concesionario de autos usados ​​obtiene un bono de $ 1000 por cada 10 autos vendidos en el lote.
  • Programa de razón variable (VR) - reforzado en promedio cada n º respuesta, pero no siempre en el n ° de respuesta. [17] : 88
    • Ejemplo de laboratorio: VR 4 = primer pellet entregado en prensas de 2 bar, segundo pellet entregado en prensas de 6 bar, tercer pellet en prensas de 4 bar (2 + 6 + 4 = 12; 12/3 = prensas de 4 bar para recibir pellet).
    • Ejemplo del mundo real: máquinas tragamonedas (porque, aunque la probabilidad de ganar el premio mayor es constante, el número de presiones de palanca necesarias para ganar el premio mayor es variable).
  • Intervalo fijo (FI): reforzado después de n períodos de tiempo.
    • Ejemplo: FI 1-s = refuerzo proporcionado para la primera respuesta después de 1 segundo.
    • Ejemplo de laboratorio: FI 15-s = el comportamiento de presión de barra de la rata se refuerza para la primera presión de barra después de 15 segundos desde el último refuerzo.
    • Ejemplo del mundo real: FI 30 min = ciclo de lavadora de 30 minutos.
  • Intervalo variable (VI): reforzado en un promedio de n períodos de tiempo, pero no siempre exactamente n períodos de tiempo. [17] : 89
    • Ejemplo: VI 4 min = primer gránulo entregado después de 2 minutos, segundo entregado después de 6 minutos, tercero entregado después de 4 minutos (2 + 6 + 4 = 12; 12/3 = 4). El refuerzo se entrega en promedio después de 4 minutos.
    • Ejemplo de laboratorio: VI 10-s = el comportamiento de presión de barra de una rata se refuerza para la primera presión de barra después de un promedio de 10 segundos transcurridos desde el último refuerzo.
    • Ejemplo del mundo real: VI 30 min = Ir a pescar: puede pescar un pez después de 10 minutos, luego tener que esperar una hora y luego tener que esperar 20 minutos.
  • Tiempo fijo (FT): proporciona un estímulo de refuerzo en un tiempo fijo desde la última entrega de refuerzo, independientemente de si el sujeto ha respondido o no. En otras palabras, es un programa no contingente.
    • Ejemplo de laboratorio: FT 5-s = rata recibe comida cada 5 segundos independientemente del comportamiento.
    • Ejemplo del mundo real: FT 30-d = una persona recibe un cheque de anualidad todos los meses independientemente del comportamiento entre cheques
  • Tiempo variable (VT): proporciona refuerzo en un tiempo variable promedio desde el último refuerzo, independientemente de si el sujeto ha respondido o no.

Se utilizan programas simples en muchos procedimientos de refuerzo diferencial [22] :

  • Refuerzo diferencial de la conducta alternativa (DRA) - Un procedimiento de condicionamiento en el que una respuesta no deseada se reduce colocándola en extinción o, con menos frecuencia, proporcionando un castigo contingente, mientras que simultáneamente proporciona un refuerzo contingente en una respuesta deseable. Un ejemplo sería un maestro que atiende a un estudiante solo cuando levanta la mano, mientras ignora al estudiante cuando llama.
  • Refuerzo diferencial de otro comportamiento (DRO): también conocido como procedimientos de entrenamiento de omisión, un procedimiento de acondicionamiento instrumental en el que se administra periódicamente un reforzador positivo solo si el participante hace algo diferente a la respuesta objetivo. Un ejemplo sería reforzar cualquier acción de la mano que no sea hurgarse la nariz. [17] : 338
  • Refuerzo diferencial de comportamiento incompatible (DRI): se utiliza para reducir un comportamiento frecuente sin castigarlo reforzando una respuesta incompatible. Un ejemplo sería el refuerzo de las palmas para reducir el hurgarse la nariz.
  • Refuerzo diferencial de la tasa de respuesta baja (DRL): se utiliza para fomentar tasas bajas de respuesta. Es como un programa de intervalos, excepto que las respuestas prematuras restablecen el tiempo requerido entre comportamientos.
    • Ejemplo de laboratorio: DRL 10-s = una rata se refuerza para la primera respuesta después de 10 segundos, pero si la rata responde antes de 10 segundos, no hay refuerzo y la rata tiene que esperar 10 segundos desde esa respuesta prematura sin otra respuesta antes de la barra. presionar conducirá a un refuerzo.
    • Ejemplo del mundo real: "Si me pides una papa frita no más de una vez cada 10 minutos, te la daré. Si pides más a menudo, no te daré ninguna".
  • Refuerzo diferencial de alta frecuencia (DRH): se utiliza para aumentar las altas tasas de respuesta. Es como un programa de intervalos, excepto que se requiere un número mínimo de respuestas en el intervalo para recibir refuerzo.
    • Ejemplo de laboratorio: DRH 10-s / FR 15 = una rata debe presionar una barra 15 veces en un incremento de 10 segundos para reforzarse.
    • Ejemplo del mundo real: "Si Lance Armstrong va a ganar el Tour de Francia , tiene que pedalear x veces durante la carrera de y horas".

Efectos de diferentes tipos de horarios simples [ editar ]

  • Proporción fija: la actividad se ralentiza después de que se entrega el reforzador, luego las tasas de respuesta aumentan hasta la siguiente entrega del reforzador (pausa posterior al reforzamiento).
  • Relación variable: tasa de respuesta rápida y constante; más resistente a la extinción .
  • Intervalo fijo: la respuesta aumenta hacia el final del intervalo; Poca resistencia a la extinción.
  • Intervalo variable: resultados de actividad constante, buena resistencia a la extinción.
  • Los programas de razón producen tasas de respuesta más altas que los programas de intervalo, cuando las tasas de refuerzo son similares.
  • Los horarios variables producen tasas más altas y una mayor resistencia a la extinción que la mayoría de los horarios fijos. Esto también se conoce como el efecto de extinción de refuerzo parcial (PREE).
  • El programa de proporción variable produce tanto la tasa más alta de respuesta como la mayor resistencia a la extinción (por ejemplo, el comportamiento de los jugadores en las máquinas tragamonedas ).
  • Los horarios fijos producen "pausas posteriores al refuerzo" (PRP), donde las respuestas cesarán brevemente inmediatamente después del refuerzo, aunque la pausa es una función del requisito de respuesta siguiente en lugar del refuerzo previo. [23]
    • El PRP de un programa de intervalo fijo es seguido con frecuencia por una tasa de respuesta acelerada "en forma de festón", mientras que los programas de razón fija producen una respuesta más "angular".
      • festón de intervalo fijo: el patrón de respuesta que se desarrolla con un programa de refuerzo de intervalo fijo, el desempeño en un intervalo fijo refleja la precisión del sujeto al decir la hora.
  • Los organismos cuyos programas de reforzamiento se "adelgazan" (es decir, que requieren más respuestas o una mayor espera antes del reforzamiento) pueden experimentar "tensión de proporción" si se reducen demasiado rápido. Esto produce un comportamiento similar al visto durante la extinción.
    • Deformación de relación: la interrupción de la respuesta que se produce cuando un requisito de respuesta de relación fija aumenta demasiado rápido.
    • Ejecución de relación: tasa de respuesta alta y constante que completa cada requisito de relación. Por lo general, un requisito de relación más alto hace que se produzcan pausas posteriores al refuerzo más largas.
  • Los programas de refuerzo parcial son más resistentes a la extinción que los programas de refuerzo continuo.
    • Los programas de razón son más resistentes que los programas de intervalos y los programas variables son más resistentes que los fijos.
    • Los cambios momentáneos en el valor de refuerzo conducen a cambios dinámicos en el comportamiento. [24]

Horarios compuestos [ editar ]

Los programas compuestos combinan dos o más programas simples diferentes de alguna manera utilizando el mismo reforzador para el mismo comportamiento. Hay muchas posibilidades; entre los que se utilizan con mayor frecuencia se encuentran:

  • Horarios alternativos : un tipo de horario compuesto en el que dos o más horarios simples están en vigor y el horario que se complete primero da como resultado un refuerzo. [25]
  • Horarios conjuntivos : un horario complejo de refuerzo en el que dos o más horarios simples están en efecto de forma independiente entre sí, y se deben cumplir los requisitos de todos los horarios simples para el refuerzo.
  • Múltiples horarios : dos o más horarios se alternan en el tiempo, con un estímulo que indica cuál está vigente. El refuerzo se entrega si se cumple el requisito de respuesta mientras está en vigor un cronograma.
    • Ejemplo: FR4 cuando se le da un silbato y FI6 cuando se le da un toque de campana.
  • Horarios mixtos : se pueden producir dos o más horarios sin ningún estímulo que indique cuál está en vigor. El refuerzo se entrega si se cumple el requisito de respuesta mientras está en vigor un cronograma.
    • Ejemplo: FI6 y luego VR3 sin ninguna advertencia de estímulo del cambio de horario.
  • Administrar dos programas de refuerzo al mismo tiempo
    Horarios concurrentes : procedimiento de refuerzo complejo en el que el participante puede elegir cualquiera de dos o más programas de refuerzo simples que están disponibles simultáneamente. Los organismos son libres de alternar entre las alternativas de respuesta en cualquier momento.
    • Ejemplo del mundo real: cambiar de canal en una televisión.
  • Programa de refuerzo de cadena concurrente: procedimiento de refuerzo complejo en el que se permite al participante elegir durante el primer eslabón cuál de varios programas de refuerzo simples estará en vigor en el segundo eslabón. Una vez que se ha hecho una elección, las alternativas rechazadas dejan de estar disponibles hasta el comienzo de la siguiente prueba.
  • Programas entrelazados : un solo programa con dos componentes en el que el progreso en un componente afecta el progreso en el otro componente. En un programa FR 60 FI 120-s entrelazado, por ejemplo, cada respuesta resta tiempo del componente de intervalo de modo que cada respuesta es "igual" a eliminar dos segundos del programa FI.
  • Horarios encadenados : el refuerzo ocurre después de que se han completado dos o más horarios sucesivos, con un estímulo que indica cuándo se ha completado un horario y ha comenzado el siguiente.
    • Ejemplo: en un horario FR 10 en presencia de una luz roja, una paloma picotea un disco verde 10 veces; luego, una luz amarilla indica que un horario FR 3 está activo; después de que la paloma picotea un disco amarillo 3 veces, una luz verde indica que está en vigor un programa VI 6-s; si este fuera el horario final de la cadena, la paloma sería reforzada para picotear un disco verde en un horario VI 6-s; sin embargo, se deben cumplir todos los requisitos de programación de la cadena antes de que se proporcione un reforzador.
  • Horarios en tándem : el refuerzo ocurre cuando se han completado dos o más requisitos de horarios sucesivos, sin ningún estímulo que indique cuándo se ha completado un horario y ha comenzado el siguiente.
    • Ejemplo: VR 10, una vez completado, el horario se cambia sin previo aviso a FR 10, luego se cambia sin previo aviso a FR 16, etc. Al final de la serie de horarios, finalmente se entrega un reforzador.
  • Horarios de orden superior : la finalización de un horario se refuerza de acuerdo con un segundo horario; por ejemplo, en FR2 (FI10 segundos), dos programas sucesivos de intervalo fijo deben completarse antes de que se refuerce una respuesta.

Horarios superpuestos [ editar ]

El término psicológico programas de refuerzo superpuestos se refiere a una estructura de recompensas en la que operan simultáneamente dos o más programas simples de refuerzo. Los reforzadores pueden ser positivos, negativos o ambos. Un ejemplo es una persona que llega a casa después de un largo día de trabajo. El comportamiento de abrir la puerta de entrada es recompensado con un gran beso en los labios por parte del cónyuge de la persona y un desgarro en los pantalones del perro de la familia que salta con entusiasmo. Otro ejemplo de programas de refuerzo superpuestos es una paloma en una jaula experimental que picotea un botón. Los picotazos entregan una tolva de grano cada 20 picotazos y acceso al agua cada 200 picotazos.

Los programas de refuerzo superpuestos son un tipo de programa compuesto que evolucionó a partir del trabajo inicial sobre programas simples de refuerzo de BF Skinner y sus colegas (Skinner y Ferster, 1957). Demostraron que los reforzadores se podían administrar en horarios y, además, que los organismos se comportaban de manera diferente en diferentes horarios. En lugar de que un reforzador, como comida o agua, se entregue cada vez como consecuencia de algún comportamiento, podría entregarse un reforzador después de más de una instancia del comportamiento. Por ejemplo, una palomaEs posible que deba presionar un interruptor de botón diez veces antes de que aparezca la comida. Este es un "programa de proporciones". Además, se podría administrar un reforzador después de un intervalo de tiempo transcurrido siguiendo un comportamiento objetivo. Un ejemplo es una rata a la que se le da un gránulo de comida inmediatamente después de la primera respuesta que ocurre después de que hayan transcurrido dos minutos desde la última presión de la palanca. A esto se le llama un "programa de intervalos".

Además, los programas de proporción pueden proporcionar un refuerzo siguiendo un número fijo o variable de comportamientos por parte del organismo individual. Del mismo modo, los programas de intervalos pueden proporcionar refuerzo siguiendo intervalos de tiempo fijos o variables después de una única respuesta del organismo. Los comportamientos individuales tienden a generar tasas de respuesta que difieren según cómo se crea el programa de refuerzo. Gran parte de la investigación posterior en muchos laboratorios examinó los efectos sobre los comportamientos de los reforzadores de programación.

Si a un organismo se le ofrece la oportunidad de elegir entre dos o más programas simples de refuerzo al mismo tiempo, la estructura de refuerzo se denomina "programa concurrente de refuerzo". Brechner (1974, 1977) introdujo el concepto de programas de refuerzo superpuestos en un intento de crear una analogía de laboratorio de las trampas sociales , como cuando los humanos cosechan en exceso.sus pesquerías o derribar sus selvas tropicales. Brechner creó una situación en la que se superponían programas de refuerzo simples. En otras palabras, una sola respuesta o grupo de respuestas de un organismo condujo a múltiples consecuencias. Los programas concurrentes de refuerzo se pueden considerar como programas "o", y los programas de refuerzo superpuestos se pueden considerar como programas "y". Brechner y Linder (1981) y Brechner (1987) expandieron el concepto para describir cómo los horarios superpuestos y la analogía de la trampa social podrían usarse para analizar la forma en que la energía fluye a través de los sistemas .

Los programas de refuerzo superpuestos tienen muchas aplicaciones del mundo real, además de generar trampas sociales . Se pueden crear muchas situaciones individuales y sociales humanas diferentes superponiendo programas de refuerzo simples. Por ejemplo, un ser humano podría tener adicciones simultáneas al tabaco y al alcohol. Se pueden crear o simular situaciones aún más complejas superponiendo dos o más programas simultáneos. Por ejemplo, un estudiante de último año de secundaria podría elegir entre ir a la Universidad de Stanford o UCLA y, al mismo tiempo, tener la opción de ingresar al Ejército o la Fuerza Aérea, y al mismo tiempo la opción de aceptar un trabajo en una empresa de Internet o un trabajo en una empresa de software. Esa es una estructura de refuerzo de tres programas de refuerzo concurrentes superpuestos.

Los programas de refuerzo superpuestos pueden crear las tres situaciones de conflicto clásicas (conflicto de aproximación-aproximación, conflicto de aproximación-evitación y conflicto de evitación-evitación) descritas por Kurt Lewin (1935) y pueden operacionalizar otras situaciones lewinianas analizadas por su análisis de campo de fuerza . Otros ejemplos del uso de esquemas de refuerzo superpuestos como herramienta analítica son su aplicación a las contingencias del control de rentas (Brechner, 2003) y el problema del vertido de desechos tóxicos en el sistema de drenaje pluvial del condado de Los Ángeles (Brechner, 2010).

Horarios concurrentes [ editar ]

En el condicionamiento operante , los programas concurrentes de refuerzo son programas de refuerzo que están disponibles simultáneamente para un sujeto animal o un participante humano, de modo que el sujeto o participante puede responder en cualquier programa. Por ejemplo, en una tarea de elección forzada de dos alternativas , una paloma en una caja de Skinner se enfrenta a dos teclas de picoteo; Se pueden dar respuestas de picoteo en cualquiera de los dos, y el refuerzo de alimentos puede seguir a un picoteo en cualquiera de ellos. Los horarios de refuerzo dispuestos para picotazos en las dos teclas pueden ser diferentes. Pueden ser independientes o pueden estar vinculados de modo que el comportamiento en una clave afecte la probabilidad de refuerzo en la otra.

No es necesario que las respuestas en los dos horarios sean físicamente distintas. En una forma alternativa de organizar horarios concurrentes, introducida por Findley en 1958, ambos horarios se organizan en una sola tecla u otro dispositivo de respuesta, y el sujeto puede responder en una segunda tecla para cambiar entre los horarios. En tal procedimiento de "Findley concurrente", un estímulo (por ejemplo, el color de la tecla principal) indica qué horario está en efecto.

Los horarios concurrentes a menudo inducen una rápida alternancia entre las teclas. Para evitar esto, se suele introducir un "retraso de cambio": cada programa se inactiva durante un breve período después de que el sujeto cambia a él.

Cuando ambos programas concurrentes son intervalos variables , se encuentra una relación cuantitativa conocida como ley de emparejamiento entre las tasas de respuesta relativas en los dos programas y las tasas de refuerzo relativas que entregan; esto fue observado por primera vez por RJ Herrnstein en 1961. La ley de emparejamiento es una regla para el comportamiento instrumental que establece que la tasa relativa de respuesta en una alternativa de respuesta particular es igual a la tasa relativa de refuerzo para esa respuesta (tasa de comportamiento = tasa de refuerzo). Los animales y los seres humanos tienden a preferir la elección de horarios. [26]

Dar forma [ editar ]

Dar forma es el refuerzo de aproximaciones sucesivas a una respuesta instrumental deseada. Al entrenar a una rata para presionar una palanca, por ejemplo, el simple hecho de girar hacia la palanca se refuerza al principio. Entonces, solo se refuerza girar y dar un paso hacia él. Los resultados de un conjunto de comportamientos inician el proceso de configuración para el siguiente conjunto de comportamientos, y los resultados de ese conjunto preparan el proceso de configuración para el siguiente conjunto, y así sucesivamente. A medida que avanza el entrenamiento, la respuesta reforzada se vuelve progresivamente más parecida a la conducta deseada; cada comportamiento subsiguiente se convierte en una aproximación más cercana al comportamiento final. [27]

Encadenando [ editar ]

El encadenamiento implica vincular comportamientos discretos en una serie, de modo que cada resultado de cada comportamiento sea tanto el refuerzo (o consecuencia) del comportamiento anterior como el estímulo (o antecedente) del siguiente comportamiento. Hay muchas formas de enseñar el encadenamiento, como el encadenamiento hacia adelante (comenzando desde el primer comportamiento en la cadena), el encadenamiento hacia atrás (comenzando desde el último comportamiento) y el encadenamiento total de tareas (en el que todo el comportamiento se enseña de principio a fin, en lugar de que como una serie de pasos). Un ejemplo es abrir una puerta cerrada. Primero se inserta la llave, luego se gira, luego se abre la puerta.

El encadenamiento hacia adelante le enseñaría al sujeto primero a insertar la clave. Una vez que se domina esa tarea, se les dice que inserten la llave y se les enseña a girarla. Una vez que se domina esa tarea, se les dice que realicen las dos primeras y luego se les enseña a abrir la puerta. El encadenamiento hacia atrás implicaría que el maestro primero insertara y girara la llave, y luego se enseñara al sujeto a abrir la puerta. Una vez que se aprende, el profesor inserta la llave y se le enseña al sujeto a girarla, luego abre la puerta como paso siguiente. Finalmente, al sujeto se le enseña a insertar la llave, y giran y abren la puerta. Una vez que se domina el primer paso, se ha enseñado toda la tarea. El encadenamiento total de la tarea implicaría enseñar la tarea completa como una sola serie, indicando todos los pasos. Las indicaciones se desvanecen (reducen) en cada paso a medida que se dominan.

La comunicación persuasiva y la teoría del refuerzo [ editar ]

Comunicación persuasiva
La persuasión influye en la forma en que piensa, actúa y siente cualquier persona. La habilidad persuasiva habla de cómo las personas comprenden la preocupación, la posición y las necesidades de las personas. La persuasión se puede clasificar en persuasión informal y persuasión formal.
Persuasión informal
Habla sobre la forma en que una persona interactúa con sus colegas y clientes. La persuasión informal se puede utilizar en equipos, memorandos y correos electrónicos.
Persuasión formal
Este tipo de persuasión se utiliza para escribir cartas al cliente, propuestas y también para presentaciones formales a cualquier cliente o colegas.
Proceso de persuasión
La persuasión relaciona cómo influye en las personas con sus habilidades, experiencia, conocimiento, liderazgo, cualidades y capacidades de equipo. La persuasión es un proceso interactivo mientras otros hacen el trabajo. Aquí hay ejemplos para los que puede utilizar las habilidades de persuasión en tiempo real. Entrevista: puede demostrar sus mejores talentos, habilidades y experiencia. Clientes: para orientar a sus clientes para el logro de las metas u objetivos. Memos: para expresar sus ideas y puntos de vista a los compañeros de trabajo para la mejora en las operaciones. La identificación de la resistencia y la actitud positiva son los roles vitales de la persuasión.

La persuasión es una forma de interacción humana. Tiene lugar cuando un individuo espera una respuesta particular de uno o más individuos y deliberadamente se propone asegurar la respuesta mediante el uso de la comunicación. El comunicador debe darse cuenta de que los diferentes grupos tienen diferentes valores. [28] : 24-25

En situaciones de aprendizaje instrumental, que involucran comportamiento operante, el comunicador persuasivo presentará su mensaje y luego esperará a que el receptor dé una respuesta correcta. Tan pronto como el receptor da la respuesta, el comunicador intentará arreglar la respuesta con alguna recompensa o refuerzo apropiado. [29]

En situaciones de aprendizaje condicional, donde hay un comportamiento respondiente, el comunicador presenta su mensaje para obtener la respuesta que desea del receptor, y el estímulo que originalmente sirvió para obtener la respuesta se convierte en el elemento reforzador o gratificante del condicionamiento. [28]

Modelos matemáticos [ editar ]

Se ha trabajado mucho en la construcción de un modelo matemático de refuerzo. Este modelo se conoce como MPR, abreviatura de principios matemáticos de refuerzo . Peter Killeen ha hecho descubrimientos clave en el campo con su investigación sobre palomas. [30]

Críticas [ editar ]

La definición estándar de refuerzo conductual ha sido criticada como circular , ya que parece argumentar que la fuerza de respuesta aumenta con el refuerzo y define el refuerzo como algo que aumenta la fuerza de respuesta (es decir, la fuerza de respuesta aumenta por cosas que aumentan la fuerza de respuesta). Sin embargo, el uso correcto [31] de refuerzo es que algo es un reforzador porquede su efecto sobre el comportamiento, y no al revés. Se vuelve circular si uno dice que un estímulo particular fortalece la conducta porque es un reforzador, y no explica por qué un estímulo está produciendo ese efecto en la conducta. Se han propuesto otras definiciones, como "conducta consumatoria supeditada a una respuesta" de FD Sheffield, pero no se utilizan ampliamente en psicología. [32]

Cada vez más, la comprensión del papel que desempeñan los reforzadores se está alejando de un efecto de "fortalecimiento" a un efecto de "señalización". [33] Es decir, la opinión de que los reforzadores aumentan la respuesta porque señalan los comportamientos que probablemente resulten en reforzamiento. Si bien en la mayoría de las aplicaciones prácticas, el efecto de cualquier reforzador será el mismo independientemente de si el reforzador está señalando o fortaleciendo, este enfoque ayuda a explicar una serie de fenómenos conductuales que incluyen patrones de respuesta en programas de reforzamiento intermitentes (festones de intervalo fijo) y el efecto de resultados diferenciales . [34]

Historia de los términos [ editar ]

En la década de 1920, el fisiólogo ruso Ivan Pavlov pudo haber sido el primero en usar la palabra refuerzo con respecto al comportamiento, pero (según Dinsmoor ) usó su afín ruso aproximado con moderación, e incluso entonces se refirió al fortalecimiento de una respuesta ya aprendida pero debilitante. . No lo usó, como lo es hoy, para seleccionar y fortalecer nuevos comportamientos. La introducción de Pavlov de la palabra extinción (en ruso) se aproxima al uso psicológico actual.

En el uso popular, el refuerzo positivo se usa a menudo como sinónimo de recompensa , y las personas (no el comportamiento) se "refuerzan", pero esto es contrario al uso técnico constante del término, ya que es una dimensión del comportamiento y no la persona. , que se fortalece. Los laicos e incluso los científicos sociales fuera de la psicología suelen utilizar el refuerzo negativo como sinónimo de castigo . Esto es contrario al uso técnico moderno, pero fue BF Skinner quien lo utilizó por primera vez de esta manera en su libro de 1938. En 1953, sin embargo, siguió a otros en el empleo de la palabra castigo y reformuló el refuerzo negativo para eliminar los estímulos aversivos.

Hay algunos dentro del campo del análisis de la conducta [35] que han sugerido que los términos "positivo" y "negativo" constituyen una distinción innecesaria al discutir el refuerzo, ya que a menudo no está claro si los estímulos se eliminan o se presentan. Por ejemplo, Iwata plantea la pregunta: "... ¿un cambio de temperatura se caracteriza con mayor precisión por la presentación de frío (calor) o la eliminación de calor (frío)?" [36] : 363 Por lo tanto, el refuerzo podría conceptualizarse como una condición previa al cambio reemplazada por una condición posterior al cambio que refuerza el comportamiento que siguió al cambio en las condiciones del estímulo.

Aplicaciones [ editar ]

El refuerzo y el castigo son omnipresentes en las interacciones sociales humanas, y se han sugerido e implementado una gran cantidad de aplicaciones de los principios operantes. A continuación se muestran algunos ejemplos.

Adicción y dependencia [ editar ]

El refuerzo positivo y negativo juega un papel central en el desarrollo y mantenimiento de la adicción y la drogodependencia . Una droga adictiva es intrínsecamente gratificante ; es decir, funciona como un reforzador positivo primario del consumo de drogas. El sistema de recompensa del cerebro le asigna prominencia de incentivo (es decir, es "deseado" o "deseado"), [37] [38] [39] de modo que a medida que se desarrolla una adicción, la privación de la droga conduce al deseo. Además, los estímulos asociados con el consumo de drogas, por ejemplo, la visión de una jeringa y el lugar de uso, se asocian con el refuerzo intenso inducido por la droga. [37] [38] [39]Estos estímulos previamente neutrales adquieren varias propiedades: su aparición puede inducir antojo, y pueden convertirse en reforzadores positivos condicionados del uso continuado. [37] [38] [39] Por lo tanto, si un individuo adicto encuentra una de estas señales de drogas, puede reaparecer un deseo por la droga asociada. Por ejemplo, las agencias antidrogas anteriormente usaban carteles con imágenes de parafernalia relacionada con las drogas como un intento de mostrar los peligros del consumo de drogas. Sin embargo, estos carteles ya no se utilizan debido a los efectos de la prominencia de los incentivos al provocar una recaída al ver los estímulos ilustrados en los carteles.

En individuos drogodependientes, el refuerzo negativo ocurre cuando una droga se autoadministra para aliviar o "escapar" de los síntomas de dependencia física (p. Ej., Temblores y sudoración) y / o dependencia psicológica (p. Ej., Anhedonia , inquietud, irritabilidad y ansiedad) que surgen durante el estado de abstinencia de drogas . [37]

Adiestramiento animal [ editar ]

Un pollo montando una patineta.

Los adiestradores de animales y los dueños de mascotas estaban aplicando los principios y prácticas del condicionamiento operante mucho antes de que estas ideas fueran nombradas y estudiadas, y el adiestramiento de animales todavía proporciona uno de los ejemplos más claros y convincentes de control operante. De los conceptos y procedimientos descritos en este artículo, algunos de los más destacados son: disponibilidad de refuerzo inmediato (por ejemplo, la bolsa siempre presente de yummies para perros); contingencia, asegurando que el refuerzo sigue el comportamiento deseado y no otra cosa; el uso de refuerzo secundario, como hacer sonar un clicker inmediatamente después de una respuesta deseada; dar forma, como hacer gradualmente que un perro salte más y más alto; refuerzo intermitente, reduciendo la frecuencia de esos yummies para inducir un comportamiento persistente sin saciedad; encadenamientodonde un comportamiento complejo se va formando gradualmente.[40]

Comportamiento infantil: capacitación en manejo de padres [ editar ]

Proporcionar un refuerzo positivo para los comportamientos apropiados de los niños es un enfoque principal de la capacitación en manejo de padres. Por lo general, los padres aprenden a recompensar el comportamiento apropiado a través de recompensas sociales (como elogios, sonrisas y abrazos), así como recompensas concretas (como pegatinas o puntos hacia una recompensa mayor como parte de un sistema de incentivos creado en colaboración con el niño). [41] Además, los padres aprenden a seleccionar comportamientos simples como un enfoque inicial y recompensan cada uno de los pequeños pasos que logra su hijo para alcanzar una meta mayor (este concepto se denomina "aproximaciones sucesivas"). [41] [42] También pueden utilizar recompensas indirectas, como gráficos de progreso.. Proporcionar un refuerzo positivo en el aula puede ser beneficioso para el éxito del estudiante. Al aplicar el refuerzo positivo a los estudiantes, es fundamental individualizarlo según las necesidades de ese estudiante. De esta manera, el estudiante comprende por qué está recibiendo el elogio, puede aceptarlo y eventualmente aprender a continuar la acción que se ganó con el refuerzo positivo. Por ejemplo, el uso de recompensas o tiempo de recreo adicional puede aplicarse más a algunos estudiantes, mientras que otros pueden aceptar la aplicación al recibir calcomanías o marcas de verificación que indiquen elogios.

Economía [ editar ]

Tanto los psicólogos como los economistas se han interesado en aplicar conceptos y hallazgos operantes al comportamiento de los humanos en el mercado. Un ejemplo es el análisis de la demanda del consumidor, indexada por la cantidad de un bien que se compra. En economía, el grado en que el precio influye en el consumo se denomina "elasticidad precio de la demanda". Ciertos productos básicos son más elásticos que otros; por ejemplo, un cambio en el precio de ciertos alimentos puede tener un gran efecto en la cantidad comprada, mientras que la gasolina y otros productos básicos pueden verse menos afectados por los cambios de precio. En términos de análisis operante, tales efectos pueden interpretarse en términos de las motivaciones de los consumidores y el valor relativo de las mercancías como reforzadores. [43]

Juegos de apuestas: programación de proporción variable [ editar ]

Como se indicó anteriormente en este artículo, un programa de razón variable produce un refuerzo después de la emisión de un número impredecible de respuestas. Este programa generalmente genera una respuesta rápida y persistente. Las máquinas tragamonedas dan sus frutos en un programa de proporción variable, y producen precisamente este tipo de comportamiento persistente de tirar de la palanca en los jugadores. Debido a que las máquinas están programadas para pagar menos dinero del que reciben, el usuario persistente de la máquina tragamonedas pierde invariablemente a largo plazo. Las máquinas tragamonedas y, por lo tanto, el refuerzo de proporción variable a menudo se han culpado como un factor subyacente a la adicción al juego. [44]

Teoría del empujón [ editar ]

La teoría de empujones (o empujones) es un concepto en la ciencia del comportamiento , la teoría política y la economía que sostiene que el refuerzo positivo y las sugerencias indirectas para tratar de lograr un cumplimiento no forzado pueden influir en los motivos, incentivos y toma de decisiones de grupos e individuos, al menos como de forma eficaz, si no más eficaz, que la instrucción, la legislación o la aplicación directas.

Alabanza [ editar ]

El concepto de elogio como medio de refuerzo de la conducta en humanos tiene sus raíces en el modelo de condicionamiento operante de BF Skinner. A través de esta lente, el elogio se ha visto como un medio de refuerzo positivo, en el que es más probable que ocurra un comportamiento observado al elogiar de manera contingente dicho comportamiento. [45] Cientos de estudios han demostrado la eficacia de los elogios para promover comportamientos positivos, en particular en el estudio del uso de elogios por parte de maestros y padres en el niño para promover un mejor comportamiento y rendimiento académico, [46] [47] pero también en el estudio de rendimiento laboral. [48]También se ha demostrado que el elogio refuerza los comportamientos positivos en individuos adyacentes no elogiados (como un compañero de clase del receptor del elogio) a través del refuerzo vicario. [49] El elogio puede ser más o menos eficaz para cambiar el comportamiento según su forma, contenido y presentación. Para que el elogio produzca un cambio positivo en la conducta, debe depender de la conducta positiva (es decir, solo administrarse después de que se promulgue la conducta objetivo), debe especificar los detalles de la conducta que se va a reforzar y debe expresarse con sinceridad y creíblemente. [50]

Reconociendo el efecto del elogio como una estrategia de refuerzo positivo, numerosas intervenciones conductuales y cognitivo-conductuales han incorporado el uso del elogio en sus protocolos. [51] [52] El uso estratégico de elogios se reconoce como una práctica basada en la evidencia tanto en la gestión del aula [51] como en las intervenciones de capacitación para padres, [47] aunque el elogio a menudo se subsume en la investigación de intervención en una categoría más amplia de refuerzo positivo, que incluye estrategias como atención estratégica y recompensas de comportamiento.

Manipulación psicológica [ editar ]

Braiker identificó las siguientes formas en que los manipuladores controlan a sus víctimas: [53]

  • Refuerzo positivo : incluye elogios, encanto superficial , simpatía superficial ( lágrimas de cocodrilo ), disculpas excesivas, dinero, aprobación, obsequios, atención, expresiones faciales como una risa o sonrisa forzada y reconocimiento público.
  • Refuerzo negativo : puede implicar sacar a uno de una situación negativa
  • Refuerzo parcial o intermitente: el refuerzo negativo parcial o intermitente puede crear un clima efectivo de miedo y duda. El refuerzo positivo parcial o intermitente puede alentar a la víctima a persistir; por ejemplo, en la mayoría de las formas de juego, es probable que el jugador gane de vez en cuando, pero aún así pierda dinero en general.
  • Castigo : incluye regaños , gritos, trato silencioso , intimidación , amenazas, palabrotas , chantaje emocional , el viaje de culpa , enfurruñarse, llorar y jugar a ser la víctima .
  • Aprendizaje traumático de una sola prueba: uso de abuso verbal , ira explosiva u otro comportamiento intimidatorio para establecer dominio o superioridad; incluso un incidente de tal comportamiento puede condicionar o entrenar a las víctimas para evitar molestar, confrontar o contradecir al manipulador.

Vinculación traumática [ editar ]

La vinculación traumática ocurre como resultado de ciclos continuos de abuso en los que el refuerzo intermitente de recompensa y castigo crea poderosos vínculos emocionales que son resistentes al cambio. [54] [55]

La otra fuente indicó que [56]'Las condiciones necesarias para la vinculación traumática son que una persona debe dominar a la otra y que el nivel de abuso aumenta de forma crónica y luego desaparece. La relación se caracteriza por períodos de comportamiento permisivo, compasivo e incluso afectuoso por parte de la persona dominante, interrumpidos por episodios intermitentes de abuso intenso. Para mantener la ventaja, el victimario manipula el comportamiento de la víctima y limita las opciones de la víctima para perpetuar el desequilibrio de poder. Cualquier amenaza al equilibrio entre el dominio y la sumisión puede enfrentarse a un ciclo de castigo cada vez mayor que va desde la intimidación hirviente hasta los arrebatos intensamente violentos. El victimario también aísla a la víctima de otras fuentes de apoyo, lo que reduce la probabilidad de detección e intervención, perjudica a la víctima 's capacidad de recibir retroalimentación autorreferencial compensatoria, y fortalece el sentido de dependencia unilateral ... Los efectos traumáticos de estas relaciones abusivas pueden incluir el deterioro de la capacidad de la víctima para una autoevaluación precisa, lo que lleva a una sensación de insuficiencia personal y una sentido subordinado de dependencia de la persona dominante. Las víctimas también pueden encontrar una variedad de consecuencias sociales y legales desagradables de su afiliación emocional y conductual con alguien que perpetró actos agresivos, incluso si ellos mismos fueron los destinatarios de la agresión.conduciendo a un sentido de insuficiencia personal y un sentido subordinado de dependencia de la persona dominante. Las víctimas también pueden encontrar una variedad de consecuencias sociales y legales desagradables de su afiliación emocional y conductual con alguien que perpetró actos agresivos, incluso si ellos mismos fueron los destinatarios de la agresión.conduciendo a un sentido de insuficiencia personal y un sentido subordinado de dependencia de la persona dominante. Las víctimas también pueden encontrar una variedad de consecuencias sociales y legales desagradables de su afiliación emocional y conductual con alguien que perpetró actos agresivos, incluso si ellos mismos fueron los destinatarios de la agresión.

Videojuegos [ editar ]

La mayoría de los videojuegos están diseñados en torno a algún tipo de ciclo de compulsión, agregando un tipo de refuerzo positivo a través de un programa de tasa variable para mantener al jugador jugando, aunque esto también puede conducir a la adicción a los videojuegos . [57]

Como parte de una tendencia en la monetización de los videojuegos en la década de 2010, algunos juegos ofrecían "cajas de botín" como recompensas o se podían comprar con fondos del mundo real que ofrecían una selección aleatoria de elementos del juego, distribuidos por rareza. La práctica se ha vinculado a los mismos métodos que las máquinas tragamonedas y otros dispositivos de juego reparten recompensas, ya que sigue un programa de tarifas variables. Si bien la percepción general de que las cajas de botín son una forma de juego, la práctica solo se clasifica como tal en algunos países como juego y legal. Sin embargo, los métodos para usar esos artículos como moneda virtual para los juegos de azar en línea o el comercio de dinero del mundo real han creado un mercado de juegos de azar que está bajo evaluación legal. [58]

Cultura del miedo en el lugar de trabajo [ editar ]

Ashforth habló sobre los lados potencialmente destructivos del liderazgo e identificó a los que él denominó pequeños tiranos : líderes que ejercen un estilo tiránico de gestión, lo que resulta en un clima de miedo en el lugar de trabajo. [59] El refuerzo negativo parcial o intermitente puede crear un clima efectivo de miedo y duda . [53] Cuando los empleados tienen la sensación de que los acosadores son tolerados, el resultado puede ser un clima de miedo. [60]

Las diferencias individuales en la sensibilidad a la recompensa , el castigo y la motivación se han estudiado bajo las premisas de la teoría de la sensibilidad al refuerzo y también se han aplicado al desempeño en el lugar de trabajo .

Ver también [ editar ]

  • Poder y control abusivos
  • Analisis de comportamiento aplicado
  • Cúspide conductual
  • Zanahoria y palo
  • Aseo infantil
  • Entrenamiento canino
  • Idealización
  • Laboriosidad aprendida
  • Efecto de sobrejustificación
  • Transferencia instrumental pavloviana
  • Castigo
  • Aprendizaje reforzado
  • Teoría de la sensibilidad al refuerzo
  • Sistema de recompensas
  • Sociedad para el análisis cuantitativo del comportamiento
  • Economía de fichas

Referencias [ editar ]

  1. ↑ a b Schultz W (julio de 2015). "Recompensa neuronal y señales de decisión: de las teorías a los datos" . Revisiones fisiológicas . 95 (3): 853–951. doi : 10.1152 / physrev.00023.2014 . PMC  4491543 . PMID  26109341 .Las recompensas en el condicionamiento operante son reforzadores positivos. ... El comportamiento operante da una buena definición de recompensas. Cualquier cosa que haga que una persona regrese por más es un refuerzo positivo y, por lo tanto, una recompensa. Aunque proporciona una buena definición, el refuerzo positivo es solo una de varias funciones de recompensa. ... Las recompensas son atractivas. Son motivadores y nos hacen esforzarnos. ... Las recompensas inducen un comportamiento de aproximación, también llamado comportamiento apetitivo o preparatorio, y comportamiento consumatorio. ... Así, cualquier estímulo, objeto, evento, actividad o situación que tenga el potencial de hacernos acercarnos y consumirlo es por definición una recompensa. ... Las recompensas intrínsecas son actividades que son placenteras por sí mismas y se realizan por sí mismas, sin ser el medio para obtener recompensas extrínsecas. ...Las recompensas intrínsecas son recompensas genuinas por derecho propio, ya que inducen el aprendizaje, el enfoque y el placer, como perfeccionar, tocar y disfrutar del piano. Aunque pueden servir para condicionar recompensas de orden superior, no están condicionadas, recompensas de orden superior, ya que para lograr sus propiedades de recompensa no es necesario emparejarlas con una recompensa incondicionada.
  2. ^ Winkielman P, Berridge KC, Wilbarger JL (enero de 2005). "Las reacciones afectivas inconscientes a rostros felices enmascarados versus enojados influyen en el comportamiento de consumo y los juicios de valor". Boletín de Personalidad y Psicología Social . 31 (1): 121–35. doi : 10.1177 / 0146167204271309 . PMID 15574667 . S2CID 7427794 .  
  3. ^ Mondadori C, Waser PG, Huston JP (junio de 1977). "Efectos dependientes del tiempo del refuerzo posterior al ensayo, castigo o ECS en el aprendizaje de evitación pasiva". Fisiología y comportamiento . 18 (6): 1103–9. doi : 10.1016 / 0031-9384 (77) 90018-X . PMID 928533 . S2CID 21534363 .  
  4. ^ Gottfried JA, Blanco NM (2011). "Capítulo 3: Recompensa: ¿Qué es? ¿Cómo se puede inferir del comportamiento?" . En White NM (ed.). Neurobiología de la sensación y la recompensa . Prensa CRC. ISBN 978-1-4200-6726-2. PMID  22593908 .
  5. ^ Malenka RC, Nestler EJ, Hyman SE (2009). "Capítulo 15: Refuerzo y trastornos adictivos". En Sydor A, Brown RY (eds.). Neurofarmacología molecular: una base para la neurociencia clínica (2ª ed.). Nueva York: McGraw-Hill Medical. págs. 364–375. ISBN 9780071481274.
  6. ^ Nestler EJ (diciembre de 2013). "Base celular de la memoria para la adicción" . Diálogos en neurociencia clínica . 15 (4): 431–443. PMC 3898681 . PMID 24459410 .  A pesar de la importancia de numerosos factores psicosociales, en su esencia, la adicción a las drogas implica un proceso biológico: la capacidad de la exposición repetida a una droga de abuso para inducir cambios en un cerebro vulnerable que impulsa la búsqueda y el consumo compulsivo de drogas, y la pérdida de control. sobre el consumo de drogas, que definen un estado de adicción. ... Una gran cantidad de literatura ha demostrado que tal inducción de ΔFosB en neuronas de tipo D1 [núcleo accumbens] aumenta la sensibilidad de un animal al fármaco, así como a las recompensas naturales y promueve la autoadministración del fármaco, presumiblemente a través de un proceso de refuerzo positivo. Otro objetivo de ΔFosB es cFos: a medida que ΔFosB se acumula con la exposición repetida al fármaco, reprime el c-Fos y contribuye al cambio molecular mediante el cual ΔFosB se induce selectivamente en el estado crónico de tratamiento con fármaco. 41. ... Además, existe una creciente evidencia de que, a pesar de una variedad de riesgos genéticos de adicción en la población, la exposición a dosis suficientemente altas de una droga durante largos períodos de tiempo puede transformar a alguien que tiene una carga genética relativamente menor en un adicto.
  7. ^ "Glosario de términos" . Escuela de Medicina Mount Sinai . Departamento de Neurociencias . Consultado el 9 de febrero de 2015 .
  8. ^ Volkow ND, Koob GF, McLellan AT (enero de 2016). "Avances neurobiológicos del modelo de adicción a la enfermedad cerebral" . Revista de Medicina de Nueva Inglaterra . 374 (4): 363–371. doi : 10.1056 / NEJMra1511480 . PMC 6135257 . PMID 26816013 .  Trastorno por uso de sustancias: término de diagnóstico en la quinta edición del Manual diagnóstico y estadístico de trastornos mentales (DSM-5) que se refiere al uso recurrente de alcohol u otras drogas que causa un deterioro clínicamente y funcionalmente significativo, como problemas de salud, discapacidad, y no cumplir con las principales responsabilidades en el trabajo, la escuela o el hogar. Según el nivel de gravedad, este trastorno se clasifica como leve, moderado o grave.
    Adicción: término que se utiliza para indicar la etapa crónica más grave del trastorno por uso de sustancias, en la que hay una pérdida sustancial de autocontrol, como lo indica el consumo compulsivo de drogas a pesar del deseo de dejar de tomarlas. En el DSM-5, el término adicción es sinónimo de la clasificación de trastorno grave por uso de sustancias.
  9. ^ Thorndike E (junio de 1898). "Algunos experimentos sobre inteligencia animal" . Ciencia . 7 (181): 818–24. Código Bibliográfico : 1898Sci ..... 7..818T . doi : 10.1126 / science.7.181.818 . PMID 17769765 . 
  10. ^ Skinner, BF " El comportamiento de los organismos: un análisis experimental ", Nueva York de 1938: Appleton-Century-Crofts
  11. ^ Skinner BF (1948). Walden Dos . Toronto: The Macmillan Company.
  12. ^ Honig W (1966). Comportamiento operante: áreas de investigación y aplicación . Nueva York: Meredith Publishing Company. pag. 381.
  13. ↑ a b c Flora S (2004). El poder del refuerzo . Albany: Prensa de la Universidad Estatal de Nueva York.
  14. ^ D'Amato MR (1969). Marx MH (ed.). Procesos de aprendizaje: condicionamiento instrumental . Toronto: The Macmillan Company.
  15. ^ Harter JK (2002). Keyes CL (ed.). Bienestar en el lugar de trabajo y su relación con los resultados empresariales: una revisión de los estudios de Gallup (PDF) . Washington DC: Asociación Americana de Psicología.
  16. ^ Skinner, BF (1974). Sobre el conductismo
  17. ^ a b c d e f g Miltenberger, RG "Modificación del comportamiento: principios y procedimientos". Thomson / Wadsworth , 2008.
  18. ^ Tucker M, Sigafoos J, Bushell H (octubre de 1998). "Uso de refuerzo no contingente en el tratamiento de la conducta desafiante. Una revisión y guía clínica". Modificación de la conducta . 22 (4): 529–47. doi : 10.1177 / 01454455980224005 . PMID 9755650 . S2CID 21542125 .  
  19. ^ Droleskey RE, Andrews K, Chiarantini L, DeLoach JR (1992). "Uso de sondas fluorescentes para describir el proceso de encapsulación por diálisis hipotónica". El uso de eritrocitos resellados como portadores y biorreactores . Avances en Medicina y Biología Experimental. 326 . págs. 73–80. doi : 10.1007 / 978-1-4615-3030-5_9 . ISBN 978-1-4613-6321-7. PMID  1284187 .
  20. ^ Baer DM, lobo MM. "La entrada en comunidades naturales de refuerzo". En Ulrich R, Stachnik T, Mabry J (eds.). Control del comportamiento humano . 2 . Glenview, IL: Scott Foresman. págs. 319-24.
  21. ^ Kohler FW, Greenwood CR (1986). "Hacia una tecnología de generalización: La identificación de contingencias naturales de refuerzo" . El analista de comportamiento . 9 (1): 19-26. doi : 10.1007 / bf03391926 . PMC 2741872 . PMID 22478644 .  
  22. ^ Vollmer TR, Iwata BA (1992). "Refuerzo diferencial como tratamiento para los trastornos de la conducta: variaciones procedimentales y funcionales". Investigación en discapacidades del desarrollo . 13 (4): 393–417. doi : 10.1016 / 0891-4222 (92) 90013-v . PMID 1509180 . 
  23. ^ Derenne A, Flannery KA (2007). "Dentro de la sesión FR Pausando". El analista de comportamiento hoy . 8 (2): 175–86. doi : 10.1037 / h0100611 .
  24. ^ McSweeney FK, Murphy ES, Kowal BP (2001). "Cambios dinámicos en el valor del reforzador: algunos conceptos erróneos y por qué debería importarle". El analista de comportamiento hoy . 2 (4): 341–349. doi : 10.1037 / h0099952 .
  25. ^ Iversen IH, Lattal KA (1991). Análisis experimental de la conducta . Amsterdam: Elsevier. ISBN 9781483291260.
  26. ^ Martin TL, Yu CT, Martin GL, Fazzio D (2006). "Sobre elección, preferencia y preferencia por elección" . El analista de comportamiento hoy . 7 (2): 234–48. doi : 10.1037 / h0100083 . PMC 3558524 . PMID 23372459 .  
  27. ^ Schacter DL, Gilbert DT, Wegner DM (2011). "Capítulo 7: Aprendizaje" . Psicología (2ª ed.). Nueva York: Worth Publishers. págs.  284–85 . ISBN 978-1-4292-3719-2.
  28. ↑ a b Bettinghaus EP (1968). Comunicación persuasiva . Holt, Rinehart y Winston, Inc.
  29. ^ Skinner BF (1938). El comportamiento de los organismos. Un análisis experimental . Nueva York: Appleton-Century-Crofts. ISBN 9780996453905.
  30. ^ Killeen PR (4 de febrero de 2010). "Principios matemáticos de refuerzo" . Ciencias del comportamiento y del cerebro . 17 (1): 105-135. doi : 10.1017 / S0140525X00033628 .
  31. ^ Skinner BF (1982). Epstein R (ed.). Skinner para el aula: trabajos seleccionados . Champaign, Ill .: Research Press. ISBN 978-0-87822-261-2.
  32. ^ Vaccarino FJ, Schiff BB, Glickman SE (1989). Mowrer RR, Klein SB (eds.). Teorías contemporáneas del aprendizaje . Hillsdale, Nueva Jersey: Lawrence Erlbaum Associates. ISBN 978-0-89859-915-2.
  33. ^ Cowie S, Davison M, Elliffe D (julio de 2011). "Refuerzo: la comida señala el momento y la ubicación de la comida futura" . Revista del Análisis Experimental del Comportamiento . 96 (1): 63–86. doi : 10.1901 / jeab.2011.96-63 . PMC 3136894 . PMID 21765546 .  
  34. ^ McCormack J, Arnold-Saritepe A, Elliffe D (junio de 2017). "El efecto de resultados diferenciales en niños con autismo". Intervenciones conductuales . 32 (4): 357–369. doi : 10.1002 / bin.1489 .
  35. ^ Michael J (2005). “Refuerzo positivo y negativo, una distinción que ya no es necesaria; o una mejor forma de hablar de las cosas malas” (PDF) . Revista de Gestión del Comportamiento Organizacional . 24 (1–2): 207–22. doi : 10.1300 / J075v24n01_15 . S2CID 144466860 . Archivado desde el original (PDF) el 9 de junio de 2004.  
  36. ^ Iwata BA (1987). "Refuerzo negativo en el análisis de comportamiento aplicado: una tecnología emergente" . Revista de análisis de comportamiento aplicado . 20 (4): 361–78. doi : 10.1901 / jaba.1987.20-361 . PMC 1286076 . PMID 3323157 .  
  37. ↑ a b c d Edwards S (2016). "Principios de refuerzo para la medicina de la adicción; desde el uso de drogas recreativas hasta el trastorno psiquiátrico". Progreso en la investigación del cerebro . 223 : 63–76. doi : 10.1016 / bs.pbr.2015.07.005 . ISBN 9780444635457. PMID  26806771 . Las sustancias de abuso (que van desde el alcohol hasta los psicoestimulantes) se ingieren inicialmente en ocasiones regulares de acuerdo con sus propiedades reforzadoras positivas. Es importante destacar que la exposición repetida a sustancias gratificantes desencadena una cadena de eventos reforzantes secundarios, por lo que las señales y los contextos asociados con el consumo de drogas pueden convertirse en reforzadores y contribuir así al uso continuo y posible abuso de la sustancia o sustancias elegidas. ...
    Una dimensión importante del refuerzo muy relevante para el proceso de adicción (y en particular la recaída) es el refuerzo secundario (Stewart, 1992). Los reforzadores secundarios (en muchos casos también considerados reforzadores condicionados) probablemente dirijan la mayoría de los procesos de reforzamiento en los seres humanos. En el caso específico de la [adicción] a las drogas, las señales y contextos que están íntima y repetidamente asociados con el consumo de drogas a menudo se volverán reforzadores ... Una pieza fundamental de la teoría de la adicción de sensibilización al incentivo de Robinson y Berridge postula que el La naturaleza de tales procesos de reforzamiento secundario, además de los reforzadores primarios mismos, puede persistir e incluso sensibilizarse con el tiempo en asociación con el desarrollo de la adicción a las drogas (Robinson y Berridge, 1993). ...
    El refuerzo negativo es una condición especial asociada con un fortalecimiento de las respuestas conductuales que terminan con algún estímulo en curso (presumiblemente aversivo). En este caso podemos definir un reforzador negativo como un estímulo motivacional que fortalece dicha respuesta de “escape”. Históricamente, en relación con la adicción a las drogas, este fenómeno se ha observado consistentemente en humanos por el cual las drogas de abuso se autoadministran para saciar una necesidad motivacional en el estado de abstinencia (Wikler, 1952).
  38. ^ a b c Berridge KC (abril de 2012). "Del error de predicción a la prominencia del incentivo: cálculo mesolímbico de la motivación de recompensa" . La Revista Europea de Neurociencia . 35 (7): 1124–43. doi : 10.1111 / j.1460-9568.2012.07990.x . PMC 3325516 . PMID 22487042 .  Cuando a un CS + pavloviano se le atribuye una prominencia de incentivo, no solo desencadena "querer" por su UCS, sino que a menudo la señal en sí se vuelve muy atractiva, incluso en un grado irracional. Esta atracción de señal es otra característica distintiva de la prominencia de los incentivos. Es difícil no mirar el CS (Wiers y Stacy, 2006; Hickey et al., 2010a; Piech et al., 2010; Anderson et al., 2011). El CS incluso adquiere algunas propiedades de incentivo similares a su UCS. Un CS atractivo a menudo provoca un enfoque motivado por el comportamiento y, a veces, un individuo puede incluso intentar 'consumir' el CS de alguna manera como su UCS (por ejemplo, comer, beber, fumar, tener relaciones sexuales con, tomar como droga). El 'querer' de un CS puede convertir también el estímulo anteriormente neutral en un reforzador condicionado instrumental, de modo que un individuo trabajará para obtener la señal (sin embargo,también existen mecanismos psicológicos alternativos para el refuerzo condicionado).
  39. ↑ a b c Berridge KC, Kringelbach ML (mayo de 2015). "Sistemas de placer en el cerebro" . Neurona . 86 (3): 646–64. doi : 10.1016 / j.neuron.2015.02.018 . PMC 4425246 . PMID 25950633 .  Un objetivo importante en el futuro para la neurociencia de la adicción es comprender cómo la motivación intensa se concentra estrechamente en un objetivo en particular. Se ha sugerido que la adicción se debe en parte a la prominencia de incentivos excesiva producida por sistemas de dopamina sensibilizados o hiperreactivos que producen un intenso "deseo" (Robinson y Berridge, 1993). Pero no se ha explicado completamente por qué un objetivo se vuelve más "deseado" que todos los demás. En adictos o pacientes estimulados por agonistas, la repetición de la estimulación con dopamina de prominencia de incentivos se atribuye a actividades individualizadas particulares, como tomar la droga adictiva o las compulsiones particulares. En situaciones de recompensa pavloviana, algunas señales de recompensa se vuelven más 'deseadas' que otras como poderosos imanes motivacionales, de formas que difieren entre individuos (Robinson et al., 2014b;Saunders y Robinson, 2013). ... Sin embargo, los efectos hedónicos pueden cambiar con el tiempo. Como un fármaco se tomaba repetidamente, la sensibilización dopaminérgica mesolímbica podría ocurrir en individuos susceptibles a amplificar el 'deseo' (Leyton y Vezina, 2013; Lodge y Grace, 2011; Wolf y Ferrario, 2010), incluso si los mecanismos hedónicos de los opioides sufrieron una regulación negativa. debido a la estimulación continua de la droga, produciendo tolerancia al 'agrado'. La sensibilización al incentivo produciría adicción, al magnificar selectivamente el "deseo" desencadenado por señales de volver a tomar la droga, y causaría una motivación tan poderosa incluso si la droga se volviera menos placentera (Robinson y Berridge, 1993).Consecuentemente, la sensibilización dopaminérgica mesolímbica podría ocurrir en individuos susceptibles a amplificar el `` deseo '' (Leyton y Vezina, 2013; Lodge y Grace, 2011; Wolf y Ferrario, 2010), incluso si los mecanismos hedónicos opioides sufrieron una regulación negativa debido a la estimulación continua de la droga, produciendo tolerancia al 'agrado'. La sensibilización al incentivo produciría adicción, al magnificar selectivamente el "deseo" desencadenado por señales de volver a tomar la droga, y causaría una motivación tan poderosa incluso si la droga se volviera menos placentera (Robinson y Berridge, 1993).Consecuentemente, la sensibilización dopaminérgica mesolímbica podría ocurrir en individuos susceptibles a amplificar el `` deseo '' (Leyton y Vezina, 2013; Lodge y Grace, 2011; Wolf y Ferrario, 2010), incluso si los mecanismos hedónicos opioides sufrieron una regulación negativa debido a la estimulación continua de la droga, produciendo tolerancia al 'agrado'. La sensibilización al incentivo produciría adicción, al magnificar selectivamente el "deseo" desencadenado por señales de volver a tomar la droga, y causaría una motivación tan poderosa incluso si la droga se volviera menos placentera (Robinson y Berridge, 1993).magnificando selectivamente el "deseo" desencadenado por una señal de volver a tomar la droga, y así poder causar motivación incluso si la droga se vuelve menos placentera (Robinson y Berridge, 1993).magnificando selectivamente el "deseo" desencadenado por una señal de volver a tomar la droga, y así poder causar motivación incluso si la droga se vuelve menos placentera (Robinson y Berridge, 1993).
  40. ^ McGreevy PD, Boakes RA (2007). Zanahorias y palos: principios del adiestramiento animal . Cambridge: Cambridge University Press. ISBN 978-0-521-68691-4.
  41. ↑ a b Kazdin AE (2010). Entrenamiento en habilidades de resolución de problemas y entrenamiento en manejo de padres para el trastorno negativista desafiante y el trastorno de conducta. Psicoterapias basadas en evidencias para niños y adolescentes (2ª ed.) , 211–226. Nueva York: Guilford Press.
  42. ^ Forgatch MS, Patterson GR (2010). Capacitación en manejo de padres - Modelo de Oregon: Una intervención para el comportamiento antisocial en niños y adolescentes. Psicoterapias basadas en evidencias para niños y adolescentes (2ª ed.) , 159–78. Nueva York: Guilford Press.
  43. ^ Domjan, M. (2009). Los principios del aprendizaje y la conducta. Compañía editorial de Wadsworth. 6ª Edición. páginas 244–249.
  44. ^ Lozano Bleda JH, Pérez Nieto MA (noviembre de 2012). "Impulsividad, inteligencia y discriminación de contingencias de refuerzo en un programa de relación fija 3". La Revista Española de Psicología . 15 (3): 922–9. doi : 10.5209 / rev_sjop.2012.v15.n3.39384 . PMID 23156902 . 
  45. ^ Kazdin, Alan (1978). Historia de la modificación de la conducta: fundamentos experimentales de la investigación contemporánea . Baltimore: University Park Press.
  46. ^ Baker GL, Barnes HJ (1992). "Síndrome de la vena cava superior: etiología, diagnóstico y tratamiento". Revista estadounidense de cuidados intensivos . 1 (1): 54–64. doi : 10.4037 / ajcc1992.1.1.54 . PMID 1307879 . 
  47. ^ a b Garland AF, Hawley KM, Brookman-Frazee L, Hurlburt MS (mayo de 2008). "Identificación de elementos comunes de tratamientos psicosociales basados ​​en evidencia para los problemas de conducta disruptiva de los niños". Revista de la Academia Estadounidense de Psiquiatría Infantil y Adolescente . 47 (5): 505-14. doi : 10.1097 / CHI.0b013e31816765c2 . PMID 18356768 . 
  48. ^ Crowell CR, Anderson DC, Abel DM, Sergio JP (1988). "Clarificación de tareas, retroalimentación de desempeño y elogio social: procedimientos para mejorar el servicio al cliente de los cajeros de los bancos" . Revista de análisis de comportamiento aplicado . 21 (1): 65–71. doi : 10.1901 / jaba.1988.21-65 . PMC 1286094 . PMID 16795713 .  
  49. ^ Goldman NC (1992). "Carcinoma adenoide quístico del conducto auditivo externo". Otorrinolaringología – Cirugía de cabeza y cuello . 106 (2): 214–5. doi : 10.1177 / 019459989210600211 . PMID 1310808 . S2CID 23782303 .  
  50. ^ Brophy J (1981). "Sobre alabar con eficacia". El diario de la escuela primaria . 81 (5): 269–278. doi : 10.1086 / 461229 . JSTOR 1001606 . 
  51. ↑ a b Simonsen B, Fairbanks S, Briesch A, Myers D, Sugai G (2008). "Prácticas basadas en evidencia en la gestión del aula: consideraciones para la práctica de la investigación". Educación y tratamiento de los niños . 31 (1): 351–380. doi : 10.1353 / etc.0.0007 . S2CID 145087451 . 
  52. ^ Weisz JR, Kazdin AE (2010). Psicoterapias basadas en evidencias para niños y adolescentes . Prensa de Guilford. ISBN 9781606235256.
  53. ↑ a b Braiker HB (2004). ¿Quién está tirando de tus hilos? Cómo romper el ciclo de manipulación . ISBN 0-07-144672-9.
  54. ^ Dutton; Pintor (1981). "Vinculación traumática: el desarrollo de vínculos emocionales en mujeres maltratadas y otras relaciones de abuso intermitente". Victimología: una revista internacional (7).
  55. ^ Chrissie Sanderson. Asesoramiento a sobrevivientes de abuso doméstico . Editores de Jessica Kingsley; 15 de junio de 2008. ISBN 978-1-84642-811-1 . pag. 84. 
  56. ^ http://www.encyclopedia.com/social-sciences/applied-and-social-sciences-magazines/traumatic-bonding
  57. ^ Hopson J (27 de abril de 2001). "Diseño de juegos conductuales" . Gamasutra .
  58. ^ Hood V (12 de octubre de 2017). "¿Las cajas de botín son juegos de azar?" . Eurogamer . Consultado el 12 de octubre de 2017 .
  59. ^ Ashforth B (1994). "Pequeña tiranía en las organizaciones". Relaciones humanas . 47 (7): 755–778. doi : 10.1177 / 001872679404700701 . S2CID 145699243 . 
  60. ^ Helge H, Sheehan MJ, Cooper CL, Einarsen S (2010). "Efectos organizativos del acoso laboral". En Einarsen S, Hoel H, Zapf D, Cooper C (eds.). Bullying y acoso en el lugar de trabajo: avances en la teoría, la investigación y la práctica (2ª ed.). Boca Raton, FL: CRC Press. ISBN 978-1-4398-0489-6.

Lectura adicional [ editar ]

  • Brechner KC (1974). Un análisis experimental de trampas sociales (tesis doctoral). Universidad Estatal de Arizona .
  • Brechner KC (1977). "Un análisis experimental de trampas sociales". Revista de Psicología Social Experimental . 13 (6): 552–64. doi : 10.1016 / 0022-1031 (77) 90054-3 .
  • Brechner KC (1987). Trampas sociales, trampas individuales y teoría en psicología social . Boletín No. 870001. Pasadena, CA: Laboratorio de Time River.
  • Brechner KC (28 de febrero de 2003). "Horarios superpuestos aplicados al control de alquileres". . En Levine DK, Pesendorfer W (eds.). Teoría económica y de juegos .
  • Brechner KC, Linder DE (1981). "Un análisis de trampa social de los sistemas de distribución de energía". En Baum A, Singer JE (eds.). Avances en Psicología Ambiental . 3 . Hillsdale, Nueva Jersey: Lawrence Erlbaum & Associates.
  • Chance P (2003). Aprendizaje y comportamiento (5ª ed.). Toronto: Thomson-Wadsworth.
  • Cowie S (2019). "Algunas debilidades de una explicación de la fuerza de respuesta de los efectos reforzadores". Revista europea de análisis de la conducta : 1-16. doi : 10.1080 / 15021149.2019.1685247 .
  • Dinsmoor JA (noviembre de 2004). "La etimología de conceptos básicos en el análisis experimental del comportamiento" . Revista del Análisis Experimental del Comportamiento . 82 (3): 311–6. doi : 10.1901 / jeab.2004.82-311 . PMC  1285013 . PMID  15693525 .
  • Ferster CB , Skinner BF (1957). Horarios de refuerzo . Nueva York: Appleton-Century-Crofts. ISBN 0-13-792309-0.
  • Lewin K (1935). Una teoría dinámica de la personalidad: artículos seleccionados . Nueva York: McGraw-Hill. ISBN 9781447497134.
  • Skinner BF (1938). El comportamiento de los organismos . Nueva York: Appleton-Century-Crofts. ISBN 9780996453905.
  • Skinner BF (1956). "Una historia de caso en el método científico". Psicólogo estadounidense . 11 (5): 221–33. doi : 10.1037 / h0047662 .
  • Zeiler MD (julio de 1968). "Horarios fijos y variables de reforzamiento independiente de la respuesta" . Revista del Análisis Experimental del Comportamiento . 11 (4): 405-14. doi : 10.1901 / jeab.1968.11-405 . PMC  1338502 . PMID  5672249 .
  • "Glosario de términos de refuerzo" . Universidad de Iowa. Archivado desde el original el 13 de abril de 2007.
  • Harter JK, Shmidt FL, Keyes CL (2002). "Bienestar en el lugar de trabajo y su relación con los resultados empresariales: una revisión de los estudios de Gallup". En Keyes CL, Haidt J (eds.). Florecer: la persona positiva y la buena vida . Washington DC: Asociación Americana de Psicología. págs. 205–224.

Enlaces externos [ editar ]

  • Un tutorial de refuerzo positivo en línea
  • Refuerzo de Scholarpedia
  • scienceofbehavior.com