Operant betinging – en innføring

(Foto: CC0, via Pixabay)

 

Se for deg at du en lørdag ringer to venner for å spørre om dere skal gjøre noe gøy. Vi kaller dem Håvard og Hanne.

Når Håvard svarer, får du huden full av kjeft. For du må jo skjønne at han ikke kan finne på noe med deg i helgene, nå som han har fått seg både dame og splitter ny TV! Dette synes du er så ubehagelig at du slutter å ringe Håvard på lørdager.

Hanne blir derimot kjempeglad for at du ringer. For det er jo akkurat i dag hun skal på fest med mange interessante folk, og skulle så gjerne hatt en å gå dit med. Dette synes du er så stas at du begynner å ringe Hanne oftere på lørdager.

I begge disse tilfellene ser vi at konsekvensene av atferden din har betydning for om atferden skjer igjen senere.

Dette er det som kalles operant betinging.

Med andre ord er operant betinging det som skjer når atferd endres som følge av den konsekvensen atferden har. Det er en form for læring.

 

Gjelder alle dyr

Operant betinging skjer hele tiden. Ikke bare i oss mennesker, i alle dyr. B.F. Skinner sine rotter er kjent for mange. Men også virvelløse dyr, som insekter, har evnen til å lære på denne måten.

Det at egenskapen er å finne over hele dyreriket, er veldig logisk hvis man ser det fra et evolusjonshistorisk perspektiv. For evnen til å endre atferd etter de konsekvensene atferden har, er selvsagt avgjørende for overlevelse i mange sammenhenger. Det dreier seg hele tiden om å justere atferden sin etter de konsekvensen den har, slik at man kan oppføre seg på den gunstigste måten. Selv sugemønsteret til nyfødte menneskebarn kan operant betinges, noe som betyr at de kan lære seg å suge pupp og få i seg melk mest mulig effektivt. Kjempesmart for overlevelse!

 

Forsterkning og straff 

Konsekvensene som etterfølger atferd, kan ha to forskjellige effekter på den fremtidige atferden.

Konsekvensene kan gjøre at atferden skjer oftere, og konsekvensene kan gjøre at atferden skjer sjeldnere. Vi snakker om henholdsvis forsterkning og straff.

I eksemplene vi begynte med, ringer du Håvard sjeldnere. Det er med andre ord snakk om straff. Men Hanne begynner du derimot å ringe oftere. Altså er atferden forsterket.

Forsterkning og straff kan foregå på to måter:

Enten ved at noe tilføres etter en atferd, eller at noe fjernes eller reduseres etter en atferd.

Det gir oss fire forskjellige konsekvenser som kan ha effekt på atferden: 

  • Positiv forsterkning: Noe (ofte noe behagelig) tilføres (+) etter en atferd, som resulterer i at atferden skjer oftere.
  • Positiv straff: Noe (ofte en aversiv stimulus/ noe ubehagelig) tilføres (+) etter en atferd, som resulterer i at atferden skjer sjeldnere.
  • Negativ forsterkning: Noe (ofte en aversiv stimulus / noe ubehagelig) fjernes (-) etter en atferd, som resulterer i at atferden skjer oftere.
  • Negativ straff: Noe (ofte noe behagelig) fjernes (-) etter en atferd, som resulterer i at atferden skjer sjeldnere.

Konsekvensen av å ringe Håvard var at du fikk kjeft, kjeft be tilført, noe som resulterte i at du ringer ham sjeldnere. Altså er det snakk om en positiv straff.

Konsekvensen av å ringe Hanne er at du fikk deg en god fest, en god opplevelse ble tilført, noe som resulterte i at du ringer henne oftere. Altså er det en positiv forsterker.

Det finnes også en tredje ting som kan skje når vi gjør noe, nemlig at konsekvensene er uten betydning for atferden. Kanskje var Håvard forkjøla den dagen, og kunne ikke finne på noe av den grunn, noe som naturlig nok ikke vil påvirke hvor ofte du ringer ham senere. Men da vil heller ikke operant betinging foregå. Nettopp fordi operant betinging er det som skjer når atferd endres som følge av den konsekvensen atferden har. Hvis konsekvensen er uvesentlig for atferden, vil den heller ikke ha noen effekt på atferden – den vil verken skje oftere eller sjeldnere.

Her ser vi hvordan de fire konsekvensene kan fungere i praksis i samme situasjon idet en leser skal trene opp meg til å skrive blogginnlegg.

 

 

Det er effekten som avgjør, ikke vår intensjon

Det er viktig å merke seg at det er effekten av konsekvensen som avgjør om det er en forsterker/straff, ikke vår intensjon.

Vi snakker med andre ord egentlig om to forskjellige ting i denne sammenheng: En eksperimentell prosedyre og en atferdsmessig prosess.

En eksperimentell prosedyre: Det å administrere en konsekvens når en ønsket/uønsket atferd inntreffer

Atferdsmessig prosess: At atferd øker/minker i frekvens.

I eksempelet over er det hele tiden snakk om det første, for det kommer jo aldri fram hvordan dette faktisk påvirker atferden min. Kun leserens prosedyrer og intensjoner. Hvis jeg ikke hadde sluttet å skrive slike innlegg som han forsøker å straffe bort i det andre bildet, hadde så hadde det heller ikke foregått en atferdsmessig prosess i meg. Han hadde bare vært kjip, kanskje greid å få utløp for litt frustrasjon. Min atferd har han ikke greid å endre. Eventuelt kunne det «backfired». Dvs. at det som var ment å være en straff, fungerte som en forsterker ved at det fikk meg til å ville skrive enda flere slike innlegg. Likeledes er det ikke alle atferder som ros fungerer som en positiv forsterker på. På min atferd vil rosende ord prelle av hvis jeg merker at det er påtatt hyggelighet, at vedkommende ikke helt mener det. Med andre ord har ikke den type konsekvens betydning for atferden min, det virker verken forsterkende eller straffende. (Tror jeg, da …)

Veldig ofte er det ikke samsvar mellom prosedyre og atferdsmessig prosess. Derav det klassiske utsagnet «jeg har prøvd å bruke positiv forsterkning på hunden min, men det funker ikke på ham, altså». Joda! Med mindre hunden egentlig er død og utstoppet, så funker positiv forsterkning. Det er bare ikke samsvar mellom prosedyre og prosess. Man får det ikke helt til. 

Atferdsmessige prosesser:

 

Vi velger prosedyrer bevisst 

I virkeligheten benytter vi oss av alle de fire prosedyrene hele tiden, om det så er snakk om å oppdra oss selv, hverandre eller dyrene våre. Men de som er bevisste på læringsprinsippene satser på en av dem eller noen av dem.

F.eks. vil de av oss som bruker det vi ofte kaller «belønningsbasert trening» når vi trener hunder, hele tiden fokusere på positiv forsterkning. Vi tilrettelegger miljøet slik at hundene sannsynligvis oppfører seg slik vi ønsker de skal gjøre, slik at vi får mulighet til å gi positive forsterkere, og dermed forsterke denne atferden; få den til å øke i frekvens. Og atferd vi ikke vil ha mer av, forsøker vi å sørge for at ikke har noen konsekvenser som kan være av betydning for atferden. Det vil si at han i det første bildet ville gjort ingenting hvis jeg skrev et innlegg han ikke likte, hvis han virkelig hadde praktisert bruk av belønningsbasert trening. Han ville altså ikke i tillegg brukt straff hvis jeg skrev noe han ikke likte. Det kommer av flere årsaker, deriblant fordi bruk av aversive stimuli, som både positiv straff og negativ forsterkning som regel innebærer, kan bringe med seg en rekke uheldige effekter, som frykt og aggresjon. Også negativ straff kan ha slike effekter.

I denne sammenheng er det enda en ting til som er verdt å merke seg: Straff, både negativ og positiv har den svakheten at det ofte gjør det vanskelig å vite hva som er den riktige atferden. Vil leseren at jeg skal skrive mer om valper? Mer om læring? Hva vil han egentlig? Jeg kan kun forstå hva han ikke vil jeg skal gjøre.

 

Det gjelder fremtidig atferd

Husk at det alltid dreier seg om hvordan konsekvensen påvirker atferden i fremtiden, uansett hvordan den virker her og nå. 

Hvis man sier et hardt «nei» når hunden tigger ved middagsbordet, og hunden går og legger seg i kurven sin, men fortsetter å tigge like mye de kommende middagene, har man bare avbrutt atferden, ikke straffet. Hunden har ikke lært å ikke tigge ved middagsbordet. 

Samme hvis du hadde lagt på røret når Håvard begynte å kjefte, men fortsatte å ringe ham like ofte. Uansett hvor ubehagelig det var mens det holdt på. Kanskje hadde du sluttet like ham så godt, du kunne til og med blitt så sur at du trekker tilbake løftet om å bli med på fotballtur til England i sommer (i et forsøk på å endre denne frekke atferden hans med negativ straff …). Men hadde du fortsatt å ringe ham like ofte, ville ikke kjeftingen ha fungert som en straff på atferden «å ringe til Håvard». 

 

Kilde: 

Anvendt atferdsanalyse. Teori og praksis (2010). Av: Svein Eikeseth og Frode Svartdal 

 

 PS: Som du har skjønt, så er jeg på Facebook.

Powered by Labrador CMS