Qu'est-ce que le conditionnement opérant? Définition et exemples

Le conditionnement opérant se produit lorsqu'une association est établie entre un comportement particulier et une conséquence pour ce comportement. Cette association est fondée sur l'utilisation de renforcement et / ou de punition pour encourager ou décourager les comportements. Le conditionnement opérant a d'abord été défini et étudié par le psychologue comportemental B.F. Skinner, qui a mené plusieurs expériences bien connues de conditionnement opérant avec des sujets animaux.

Points clés: conditionnement des opérateurs

  • Le conditionnement opérant est le processus d'apprentissage par le renforcement et la punition.
  • Dans le conditionnement opérant, les comportements sont renforcés ou affaiblis en fonction des conséquences de ce comportement.
  • Le conditionnement opérant a été défini et étudié par le psychologue comportemental B.F. Skinner.

Les origines

B.F. Skinner était un comportementaliste, ce qui signifie qu'il croyait que la psychologie devrait se limiter à l'étude des comportements observables. Alors que d'autres comportementalistes, comme John B. Watson, concentré sur le conditionnement classique, Skinner était plus intéressé par l'apprentissage qui se passait par le conditionnement opérant.

instagram viewer

Il a observé que réponses de conditionnement classiques ont tendance à être déclenchées par des réflexes innés qui se produisent automatiquement. Il a appelé ce genre de comportement intimé. Il a distingué comportement du répondant du comportement opérant. Comportement des opérateurs était le terme Skinner utilisé pour décrire un comportement qui est renforcé par les conséquences qui en découlent. Ces conséquences jouent un rôle important dans la répétition ou non d'un comportement.

Skinner's les idées étaient basées sur La loi d'effet d'Edward Thorndike, qui stipulait qu'un comportement qui suscite des conséquences positives probablement être répété, tandis que le comportement qui provoque des conséquences négatives ne sera probablement pas répété. Skinner a introduit le concept de renforcement dans les idées de Thorndike, précisant que le comportement qui sera renforcé sera probablement répété (ou renforcé).

Pour étudier le conditionnement opérant, Skinner a mené des expériences en utilisant une «boîte Skinner» une petite boîte qui avait un levier à une extrémité qui fournirait de la nourriture ou de l'eau une fois pressé. Un animal, comme un pigeon ou un rat, a été placé dans la boîte où il était libre de se déplacer. Finalement, l'animal presserait le levier et serait récompensé. Skinner a constaté que ce processus a conduit l'animal à appuyer plus fréquemment sur le levier. Skinner mesurerait l'apprentissage en suivant le taux de réponses de l'animal lorsque ces réponses étaient renforcées.

Renforcement et punition

À travers ses expériences, Skinner a identifié les différents types de renforcement et de punition qui encouragent ou découragent les comportements.

Renforcement

Un renforcement qui suit de près un comportement encouragera et renforcera ce comportement. Il existe deux types de renfort:

  • Renforcement positif se produit lorsqu'un comportement aboutit à un résultat favorable, par ex. un chien recevant une friandise après avoir obéi à une commande, ou un élève recevant un compliment de l'enseignant après s'être bien comporté en classe. Ces techniques augmentent la probabilité que l'individu répète le comportement souhaité afin de recevoir à nouveau la récompense.
  • Renforcement négatif se produit lorsqu'un comportement entraîne la suppression d'une expérience défavorable, par ex. un expérimentateur cessant de donner des chocs électriques à un singe lorsque le singe appuie sur un certain levier. Dans ce cas, le comportement de pression sur le levier est renforcé car le singe voudra à nouveau retirer les chocs électriques défavorables.

De plus, Skinner a identifié deux types différents de renforçateurs.

  • Renforts primaires renforcent naturellement les comportements parce qu'ils sont intrinsèquement souhaitables, par ex. nourriture.
  • Renforts conditionnés renforcer les comportements non pas parce qu'ils sont intrinsèquement souhaitables, mais parce que nous apprendre de les associer à des renforçateurs primaires. Par exemple, le papier-monnaie n'est pas intrinsèquement souhaitable, mais il peut être utilisé pour acquérir des biens intrinsèquement souhaitables, comme de la nourriture et un abri.

Châtiment

La punition est l'opposé du renforcement. Lorsque la punition suit un comportement, elle décourage et affaiblit ce comportement. Il existe deux types de punition.

  • Punition positive (ou punition par application) se produit lorsqu'un comportement est suivi d'un résultat défavorable, par ex. un parent donne une fessée à un enfant après que l'enfant utilise un mot maudit.
  • Punition négative (ou punition par renvoi) se produit lorsqu'un comportement mène à la suppression de quelque chose de favorable, par ex. un parent qui refuse à un enfant son allocation hebdomadaire parce que l'enfant s'est mal conduit.

Bien que la punition soit encore largement utilisée, Skinner et de nombreux autres chercheurs ont constaté que la punition n'est pas toujours efficace. La punition peut supprimer un comportement pendant un certain temps, mais le comportement indésirable a tendance à revenir à long terme. La punition peut également avoir des effets secondaires indésirables. Par exemple, un enfant qui est puni par un enseignant peut devenir incertain et craindre car il ne sait pas exactement quoi faire pour éviter de futures punitions.

Au lieu de punition, Skinner et d'autres ont suggéré de renforcer les comportements souhaités et d'ignorer les comportements indésirables. Renforcement raconte un individu quel comportement est souhaité, tandis que la punition indique seulement à l'individu quel comportement n'est pas souhaité.

Mise en forme du comportement

Le conditionnement opérant peut conduire à des comportements de plus en plus complexes façonner, également appelée «méthode d'approximation». La mise en forme se fait étape par étape à mesure que chaque partie d'un comportement plus complexe est renforcée. La mise en forme commence par le renforcement de la première partie du comportement. Une fois cette partie du comportement maîtrisée, le renforcement ne se produit que lorsque la deuxième partie du comportement se produit. Ce modèle de renforcement se poursuit jusqu'à ce que tout le comportement soit maîtrisé.

Par exemple, lorsqu'un enfant apprend à nager, il se peut qu'il soit d'abord félicité pour s'être mis à l'eau. Elle est à nouveau félicitée lorsqu'elle apprend à donner des coups de pied, et à nouveau lorsqu'elle apprend des mouvements de bras spécifiques. Enfin, elle est félicitée pour s'être propulsée dans l'eau en effectuant un coup spécifique et en donnant des coups de pied en même temps. Grâce à ce processus, un comportement entier a été façonné.

Calendriers de renforcement

Dans le monde réel, le comportement n'est pas constamment renforcé. Skinner a constaté que la fréquence du renforcement peut avoir un impact sur la rapidité et la réussite de l'apprentissage d'un nouveau comportement. Il a spécifié plusieurs programmes de renforcement, chacun avec un timing et des fréquences différents.

  • Renforcement continu se produit lorsqu'une réponse particulière suit chaque performance d'un comportement donné. L'apprentissage se fait rapidement avec un renforcement continu. Cependant, si le renforcement est arrêté, le comportement diminuera rapidement et s'arrêtera finalement complètement, ce qui est appelé extinction.
  • Horaires à taux fixe récompense le comportement après un nombre spécifié de réponses. Par exemple, un enfant peut obtenir une étoile après chaque cinquième tâche qu'il accomplit. Selon ce calendrier, le taux de réponse ralentit juste après la remise de la récompense.
  • Horaires à ratio variable varier le nombre de comportements requis pour obtenir une récompense. Ce calendrier conduit à un taux de réponses élevé et est également difficile à éteindre car sa variabilité maintient le comportement. Les machines à sous utilisent ce type de programme de renforcement.
  • Horaires à intervalle fixe offrir une récompense après un certain laps de temps. Être payé à l'heure est un exemple de ce type de programme de renforcement. Tout comme le calendrier à taux fixe, le taux de réponse augmente à mesure que la récompense approche mais ralentit juste après la réception de la récompense.
  • Horaires à intervalle variable varier la quantité de temps entre les récompenses. Par exemple, un enfant qui reçoit une allocation à différents moments de la semaine tant qu'il a manifesté des comportements positifs suit un horaire à intervalles variables. L'enfant continuera d'afficher un comportement positif en prévision de recevoir éventuellement son allocation.

Exemples de conditionnement opérant

Si vous avez déjà entraîné un animal de compagnie ou enseigné à un enfant, vous avez probablement utilisé le conditionnement opérant dans votre propre vie. Le conditionnement opérant est encore fréquemment utilisé dans diverses circonstances du monde réel, y compris en classe et en milieu thérapeutique.

Par exemple, un enseignant pourrait renforcer les élèves à faire leurs devoirs régulièrement en donnant périodiquement des quiz pop qui posent des questions similaires aux devoirs de devoirs récents. De plus, si un enfant fait une crise de colère pour attirer l'attention, le parent peut ignorer le comportement et reconnaître à nouveau l'enfant une fois la crise terminée.

Le conditionnement opérant est également utilisé dans modification du comportement, une approche pour le traitement de nombreux problèmes chez les adultes et les enfants, y compris les phobies, l'anxiété, l'énurésie nocturne et bien d'autres. Une façon de modifier le comportement peut être implémentée via un Économie symbolique, dans lequel les comportements souhaités sont renforcés par des jetons sous la forme de badges numériques, de boutons, de puces, d'autocollants ou d'autres objets. Finalement, ces jetons peuvent être échangés contre de vraies récompenses.

Critiques

Alors que le conditionnement opérant peut expliquer de nombreux comportements et est encore largement utilisé, il existe plusieurs critiques du processus. Tout d'abord, le conditionnement opérant est accusé d'être un explication incomplète pour l'apprentissage car il néglige le rôle des éléments biologiques et cognitifs.

De plus, le conditionnement opérant dépend d'un Figure d'autorité pour renforcer le comportement et ignore le rôle de la curiosité et la capacité d'un individu à faire ses propres découvertes. Les critiques s'opposent à l'accent mis par le conditionnement opérant sur le contrôle et la manipulation des comportements, arguant qu'ils peuvent conduire à des pratiques autoritaires. Skinner croyait cependant que les environnements contrôlent naturellement le comportement et que les gens peuvent choisir d'utiliser ces connaissances en bien ou en mal.

Enfin, parce que les observations de Skinner sur le conditionnement opérant reposaient sur des expériences avec des animaux, il est critiqué extrapoler de ses études animales pour faire des prédictions sur le comportement humain. Certains psychologues pensent que ce type de généralisation est défectueux car les humains et les animaux non humains sont physiquement et cognitivement différents.

Sources

  • Cerise, Kendra. "Qu'est-ce que le conditionnement opérant et comment ça marche?" Verywell Mind, 2 octobre 2018. https://www.verywellmind.com/operant-conditioning-a2-2794863
  • Crain, William. Théories du développement: concepts et applications. 5e éd., Pearson Prentice Hall. 2005.
  • Goldman, Jason G. «Qu'est-ce que le conditionnement opérant? (Et comment cela explique-t-il la conduite de chiens?) » Scientifique américain, 13 décembre 2012. https://blogs.scientificamerican.com/thoughtful-animal/what-is-operant-conditioning-and-how-does-it-explain-driving-dogs/
  • McLeod, Saul. "Skinner - Conditionnement opérant." Psychologie simplement, 21 janvier 2018. https://www.simplypsychology.org/operant-conditioning.html#class
instagram story viewer