¿Qué es el condicionamiento operante? Definición y ejemplos

El condicionamiento operante ocurre cuando se hace una asociación entre un comportamiento particular y una consecuencia de ese comportamiento. Esta asociación se basa en el uso de refuerzo y / o castigo para alentar o desalentar el comportamiento. El condicionamiento operante fue definido y estudiado por primera vez por el psicólogo conductual B.F. Skinner, quien realizó varios experimentos de condicionamiento operante bien conocidos con sujetos animales.

Conclusiones clave: condicionamiento operativo

El condicionamiento operante es el proceso de aprendizaje a través del refuerzo y el castigo.
En el condicionamiento operante, los comportamientos se fortalecen o debilitan según las consecuencias de ese comportamiento.
El condicionamiento operante fue definido y estudiado por el psicólogo conductual B.F. Skinner.

Orígenes

B.F. Skinner fue un conductista, lo que significa que creía que la psicología debería limitarse al estudio de los comportamientos observables. Mientras que otros conductistas, como John B. Watson, centrado en el condicionamiento clásico, Skinner estaba más interesado en el aprendizaje que sucedió a través del condicionamiento operante.

instagram viewer

Observó que en respuestas de condicionamiento clásico tienden a desencadenarse por reflejos innatos que ocurren automáticamente. Él llamó a este tipo de comportamiento demandado. Distinguió comportamiento del encuestado del comportamiento operante. Comportamiento operativo fue el término que Skinner usó para describir un comportamiento reforzado por las consecuencias que le siguen. Esas consecuencias juegan un papel importante en si un comportamiento se realiza nuevamente o no.

De Skinner las ideas se basaron en La ley de efecto de Edward Thorndike, que declaró que el comportamiento que provoca consecuencias positivas probablemente se repita, mientras que el comportamiento que provoca consecuencias negativas probablemente no se repetirá. Skinner introdujo el concepto de refuerzo en las ideas de Thorndike, especificando que el comportamiento reforzado probablemente se repetirá (o fortalecerá).

Para estudiar el condicionamiento operante, Skinner realizó experimentos usando una "Caja Skinner" una pequeña caja que tenía una palanca en un extremo que proporcionaría comida o agua cuando se presiona. Se colocó un animal, como una paloma o una rata, en la caja donde podía moverse libremente. Finalmente, el animal presionaría la palanca y sería recompensado. Skinner descubrió que este proceso hacía que el animal apretara la palanca con más frecuencia. Skinner mediría el aprendizaje rastreando la tasa de respuestas del animal cuando esas respuestas se reforzaran.

Refuerzo y Castigo

A través de sus experimentos, Skinner identificó los diferentes tipos de refuerzo y castigo que fomentan o desalientan el comportamiento.

Reforzamiento

El refuerzo que sigue de cerca un comportamiento alentará y fortalecerá ese comportamiento. Hay dos tipos de refuerzo:

Refuerzo positivo ocurre cuando un comportamiento produce un resultado favorable, p. un perro que recibe un regalo después de obedecer una orden, o un estudiante que recibe un cumplido del maestro después de comportarse bien en clase. Estas técnicas aumentan la probabilidad de que el individuo repita el comportamiento deseado para recibir nuevamente la recompensa.
Reforzamiento negativo ocurre cuando un comportamiento resulta en la eliminación de una experiencia desfavorable, p. un experimentador que deja de dar descargas eléctricas a un mono cuando el mono presiona cierta palanca. En este caso, el comportamiento de presionar la palanca se ve reforzado porque el mono querrá eliminar nuevamente las descargas eléctricas desfavorables.

Además, Skinner identificó dos tipos diferentes de reforzadores.

Reforzadores primarios naturalmente, refuerzan el comportamiento porque son innatamente deseables, p. comida.
Reforzadores acondicionados reforzar el comportamiento no porque sean deseados por naturaleza, sino porque nosotros aprender asociarlos con reforzadores primarios. Por ejemplo, el papel moneda no es deseable de forma innata, pero puede usarse para adquirir bienes deseables de forma innata, como alimentos y vivienda.

Castigo

El castigo es lo opuesto al refuerzo. Cuando el castigo sigue a un comportamiento, lo desalienta y debilita. Hay dos tipos de castigo.

Castigo positivo (o castigo por aplicación) ocurre cuando un comportamiento es seguido por un resultado desfavorable, p. un padre azota a un niño después de que el niño usa una palabra de maldición.
Castigo negativo (o castigo por remoción) ocurre cuando un comportamiento conduce a la eliminación de algo favorable, p. un padre que niega a un niño su asignación semanal porque el niño se ha portado mal.

Aunque el castigo todavía se usa ampliamente, Skinner y muchos otros investigadores descubrieron que el castigo no siempre es efectivo. El castigo puede suprimir un comportamiento por un tiempo, pero el comportamiento no deseado tiende a reaparecer a la larga. El castigo también puede tener efectos secundarios no deseados. Por ejemplo, un niño que es castigado por un maestro puede volverse inseguro y temeroso porque no sabe exactamente qué hacer para evitar futuros castigos.

En lugar de castigo, Skinner y otros sugirieron reforzar los comportamientos deseados e ignorar los comportamientos no deseados. Reforzamiento le dice a un individuo qué comportamiento se desea, mientras que el castigo solo le dice al individuo qué comportamiento no se desea.

Conformación de comportamiento

El condicionamiento operativo puede conducir a comportamientos cada vez más complejos a través de formación, también conocido como el "método de aproximaciones". El modelado ocurre paso a paso a medida que se refuerza cada parte de un comportamiento más complejo. La conformación comienza reforzando la primera parte del comportamiento. Una vez que se domina esa parte del comportamiento, el refuerzo solo ocurre cuando ocurre la segunda parte del comportamiento. Este patrón de refuerzo continúa hasta que se domine todo el comportamiento.

Por ejemplo, cuando a un niño se le enseña a nadar, inicialmente puede ser elogiado solo por meterse en el agua. Ella es elogiada nuevamente cuando aprende a patear, y nuevamente cuando aprende golpes específicos del brazo. Finalmente, es elogiada por impulsarse a sí misma a través del agua realizando un golpe específico y pateando al mismo tiempo. A través de este proceso, se ha moldeado un comportamiento completo.

Horarios de refuerzo

En el mundo real, el comportamiento no se refuerza constantemente. Skinner descubrió que la frecuencia del refuerzo puede afectar la rapidez y el éxito con el que uno aprende un nuevo comportamiento. Especificó varios horarios de refuerzo, cada uno con diferentes tiempos y frecuencias.

Refuerzo continuo ocurre cuando una respuesta particular sigue a todos y cada uno de los comportamientos de un comportamiento dado. El aprendizaje ocurre rápidamente con refuerzo continuo. Sin embargo, si se detiene el refuerzo, el comportamiento disminuirá rápidamente y finalmente se detendrá por completo, lo que se conoce como extinción.
Horarios de relación fija comportamiento de recompensa después de un número específico de respuestas. Por ejemplo, un niño puede obtener una estrella después de cada quinta tarea que completa. En este cronograma, la tasa de respuesta se ralentiza justo después de que se entrega la recompensa.
Horarios de relación variable variar la cantidad de comportamientos necesarios para obtener una recompensa. Este cronograma conduce a una alta tasa de respuestas y también es difícil de extinguir porque su variabilidad mantiene el comportamiento. Las máquinas tragamonedas utilizan este tipo de programa de refuerzo.
Horarios de intervalo fijo proporcionar una recompensa después de que pase una cantidad específica de tiempo. Recibir el pago por hora es un ejemplo de este tipo de programa de refuerzo. Al igual que el cronograma de relación fija, la tasa de respuesta aumenta a medida que se acerca la recompensa, pero se ralentiza justo después de recibir la recompensa.
Horarios de intervalo variable variar la cantidad de tiempo entre recompensas. Por ejemplo, un niño que recibe un subsidio en varios momentos durante la semana, siempre y cuando haya exhibido algunos comportamientos positivos, está en un horario de intervalo variable. El niño continuará exhibiendo un comportamiento positivo en anticipación de eventualmente recibir su asignación.

Ejemplos de condicionamiento operante

Si alguna vez entrenó a una mascota o enseñó a un niño, es probable que haya utilizado el condicionamiento operante en su propia vida. El condicionamiento operante todavía se usa con frecuencia en diversas circunstancias del mundo real, incluso en el aula y en entornos terapéuticos.

Por ejemplo, un maestro podría reforzar a los estudiantes haciendo su tarea regularmente al dar periódicamente cuestionarios que hacen preguntas similares a las tareas recientes. Además, si un niño hace un berrinche para llamar la atención, el padre puede ignorar el comportamiento y luego reconocer al niño nuevamente una vez que el berrinche ha terminado.

El acondicionamiento operante también se utiliza en Modificación de comportamiento, un enfoque para el tratamiento de numerosos problemas en adultos y niños, incluidas fobias, ansiedad, enuresis y muchos otros. Una forma de modificar el comportamiento puede implementarse es a través de un economía simbólica, en el que los comportamientos deseados se ven reforzados por tokens en forma de insignias digitales, botones, chips, pegatinas u otros objetos. Finalmente, estos tokens se pueden cambiar por recompensas reales.

Criticas

Si bien el condicionamiento operante puede explicar muchos comportamientos y todavía se usa ampliamente, existen varias críticas al proceso. Primero, el condicionamiento operante es acusado de ser un explicación incompleta para aprender porque descuida el papel de los elementos biológicos y cognitivos.

Además, el condicionamiento operante depende de un figura de autoridad para reforzar el comportamiento e ignora el papel de la curiosidad y la capacidad de un individuo para hacer sus propios descubrimientos. Los críticos objetan el énfasis del condicionamiento operante en controlar y manipular el comportamiento, argumentando que pueden conducir a prácticas autoritarias. Sin embargo, Skinner creía que los entornos naturalmente controlan el comportamiento y que las personas pueden elegir usar ese conocimiento para bien o para mal.

Finalmente, debido a que las observaciones de Skinner sobre el condicionamiento operante se basaron en experimentos con animales, es criticado por extrapolando de sus estudios en animales para hacer predicciones sobre el comportamiento humano. Algunos psicólogos creen que este tipo de generalización es errónea porque los humanos y los animales no humanos son física y cognitivamente diferentes.

Fuentes

Cherry, Kendra. "¿Qué es el condicionamiento operante y cómo funciona?" Verywell Mind, 2 de octubre de 2018. https://www.verywellmind.com/operant-conditioning-a2-2794863
Crain, William. Teorías del desarrollo: conceptos y aplicaciones. 5ª ed., Pearson Prentice Hall. 2005.
Goldman, Jason G. “¿Qué es el condicionamiento operante? (¿Y cómo explica conducir perros?) " Científico americano, 13 de diciembre de 2012. https://blogs.scientificamerican.com/thoughtful-animal/what-is-operant-conditioning-and-how-does-it-explain-driving-dogs/
McLeod, Saul. "Skinner - Acondicionamiento operante". Simplemente psicología, 21 de enero de 2018. https://www.simplypsychology.org/operant-conditioning.html#class