Condiționarea operantă

Condiționarea operantă este o formă de învățare. În cadrul acesteia, un individ își schimbă comportamentul din cauza consecințelor (rezultatelor) comportamentului său.

Persoana sau animalul învață că comportamentul său are o consecință. Această consecință poate fi

Întărire: un eveniment pozitiv sau recompensator. Aceasta face ca comportamentul să apară mai des
Pedeapsă: un eveniment negativ sau pedepsitor. Acest lucru face ca comportamentul să apară mai rar
Extincție: nu urmează niciun eveniment, astfel încât comportamentul nu are consecințe. Atunci când un comportament nu are consecințe, acesta va apărea mai rar.

Există patru contexte diferite în condiționarea operantă. Aici, termenii "pozitiv" și "negativ" nu sunt utilizați în sensul lor de bază; pozitiv înseamnă că se adaugă ceva, iar negativ înseamnă că se elimină ceva:

Întărirea pozitivă (adesea doar "întărire") are loc atunci când există o recompensă pentru o formă de comportament. Acest lucru va crește frecvența cu care apare comportamentul respectiv. În experimentul cutiei Skinner, recompensa este sub formă de hrană atunci când șobolanul apasă o pârghie.
Întărirea negativă (uneori "scăparea") apare atunci când un stimul aversiv este îndepărtat. Acest lucru va crește frecvența la care apare comportamentul. În experimentul cutiei Skinner, a existat un zgomot puternic, care a fost eliminat atunci când șobolanul a apăsat maneta.
Pedeapsa pozitivă apare atunci când se adaugă un stimulent, ceea ce face ca comportamentul să apară mai rar. Exemple de stimuli pot fi un zgomot puternic, un șoc electric (șobolan) sau o bătaie (copil).
Pedeapsa negativă are loc atunci când un stimul este eliminat, ceea ce face ca acel comportament să apară mai rar. Un exemplu ar putea fi jucăria unui copil care este luată după ce acesta are un comportament nedorit.

Ideea de condiționare operantă a fost descoperită pentru prima dată de Edward Thorndike și analizată de B.F. Skinner.

Condiționarea operantă este diferită de condiționarea clasică a lui Pavlov. Condiționarea operantă se referă la modificarea voluntară a comportamentului; condiționarea clasică se referă la antrenarea unui reflex.

Legea efectului lui Thorndike

Condiționarea operantă, numită uneori învățare instrumentală, a fost studiată pentru prima dată de Edward L. Thorndike (1874-1949). El a observat comportamentul pisicilor care încercau să scape din cutii de puzzle făcute în casă. Atunci când au fost puse pentru prima dată în cutii, pisicile au avut nevoie de mult timp pentru a evada. Odată cu experiența, răspunsurile reușite au apărut mai frecvent, permițând pisicilor să evadeze în mai puțin timp. În legea efectului, Thorndike a teoretizat că comportamentele urmate de consecințe satisfăcătoare tind să fie repetate, iar cele care produc consecințe neplăcute au mai puține șanse de a fi repetate. Pe scurt, unele consecințe întăreau comportamentul, iar unele consecințe îl slăbeau. Thorndike a produs primele curbe de învățare cunoscute prin această procedură.

B.F. Skinner (1904-1990) a elaborat o analiză mai detaliată a condiționării operante. Skinner a inventat camera de condiționare operantă care i-a permis să măsoare rata de răspuns ca variabilă dependentă cheie. El a folosit o înregistrare a apăsărilor de pârghie sau a ciupiturilor de taste.

Principiile condiționării operante:

Discriminarea, generalizarea și importanța contextului.

Învățarea are loc în contexte.
Majoritatea comportamentelor se află sub controlul stimulilor: un anumit răspuns apare numai în prezența unui stimul adecvat.
Controlul stimulilor este eficient chiar dacă stimulul nu are nicio semnificație pentru respondent.

Extincție: comportamentul operant suferă extincție atunci când încetează întărirea.

Întăririle apar doar atunci când a fost dat răspunsul adecvat și este posibil să nu apară nici măcar atunci. Comportamentele nu se slăbesc și nu se sting din această cauză.
Rezultatele depind în parte de frecvența cu care este primită întărirea.

Programele de întărire: momentul în care se efectuează întăririle este crucial.

Program cu intervale fixe: întăririle sunt prezentate la intervale de timp fixe, cu condiția ca răspunsul adecvat să fie dat.
Program cu interval variabil: un comportament este întărit pe baza unui timp mediu care a trecut de la ultima întărire. Programele de proporții: se bazează pe raportul dintre răspunsurile la întăriri.
Program cu intervale fixe: întărirea este furnizată după ce a fost dat un anumit număr de răspunsuri. Cazul special de prezentare a întăririi după fiecare răspuns se numește întărire continuă.
Program cu interval variabil: întărirea se bazează pe un anumit număr mediu de răspunsuri.

Întrebări și răspunsuri

Î: Ce este condiționarea operantă?

R: Condiționarea operantă este o formă de învățare în care un individ își schimbă comportamentul datorită consecințelor (rezultatelor) comportamentului.

Î: Care sunt cele patru contexte ale condiționării operante?

R: Cele patru contexte ale condiționării operante sunt întărirea pozitivă, întărirea negativă, pedeapsa pozitivă și pedeapsa negativă.

Î: Cum funcționează întărirea pozitivă?

R: Întărirea pozitivă are loc atunci când există o recompensă pentru o formă de comportament, ceea ce va crește frecvența cu care apare comportamentul respectiv.

Î: Cum funcționează întărirea negativă?

R: Întărirea negativă apare atunci când un stimul aversiv este eliminat, ceea ce va crește frecvența cu care apare comportamentul.

Î: Cum funcționează pedeapsa pozitivă?

R: Pedeapsa pozitivă are loc atunci când se adaugă un stimul, ceea ce face ca comportamentul să apară mai rar.
Î: Cum funcționează pedeapsa negativă? R: Pedeapsa negativă are loc atunci când un stimul este eliminat, ceea ce are ca rezultat reducerea frecvenței comportamentului.

Î: Cine a descoperit primul condiționarea operantă?

R: Edward Thorndike a descoperit prima dată condiționarea operantă, iar aceasta a fost analizată ulterior de B.F. Skinner.