Belønningsplassering

Belønningsplassering

Det viktigste er å klikke presist når hunden utfører adferden korrekt. I mange tilfeller kan du imidlertid også effektivisere treningen ytterligere ved å servere forsterkeren på en spesiell måte etter klikket.

Det er grovt sett 4 forskjellige kategorier «belønningsplassering». Du kan se eksempel på alle utført i praksis i dette lille onlinekurset på Canisakademiet.no. 

Her kommer en kort beskrivelse av de fire kategoriene (med en bonuskategori på kjøpet).

1 – Belønning i posisjon («room service»)

Dette vil si å servere forsterkeren i mens hunden blir i den posisjonen den er når du klikket (i stedet for å komme til deg når du klikker). Dette er en vanlig måte å forsterke på f.eks. når du trener «ligg». Vi klikker da idet hunden legger seg, og serverer forsterkerern mens hunden fortsatt ligger.

Hvis vi trener fremmadsending til rute, kan «belønning i posisjon» innebære at vi klikker idet hunden løper ut til riktig punkt inne i ruta, og at vi deretter løper fram til hunden og belønner inne i ruta, eller evt kaster en ball direkte til hunden.

Formålet med denne typen belønningsplassering er på en måte å få «2 adferder forprisen av  1 forsterker». Vi forsterker selve adferden vi trener (f.eks. ligg) med klikket, og forsterker i tillegg «bli liggende i samme posisjon» med måten vi serverer forsterkeren på.

 

2 – Klar til neste repetisjon

Denne typen belønningsplassering innebærer at vi kikker for riktig adferd, og at vi deretter bruker forsterkeren til å manøvrere hunden i riktig posisjon for neste repetisjon. Dette kan innebære at vi leker med hunden samtidig som vi forflytter oss til neste startpunkt. Det kan også innebære at vi serverer godbiten slik at vi snur hundens hode i riktig retning slik at det er enkelt for hunden å starte neste repetisjon med en gang den har svelget godbiten.

Noen ganger vil «klar til neste repetisjon» og «Belønning i posisjon» være det samme. Hvis du f.eks. trener «Bli liggende», kan du belønne mens hunden ligger. Dette er «room service», men samtidig er det også «klar til neste repetisjon», ettersom hunden jo skal også skal starte neste repetisjon liggende på samme plass. Det samme gjelder f.eks. når du trener vendinger på stedet under fri ved foten.

Formålet med denne typen belønningsplassering er å  redusere dødtid og få bedre «flyt» i treningen. Når hunden hele tiden veksler mellom forsterkning – arbeid – forsterkning (uten dødtid og unødvendig forflytninger i mellomtiden), blir treningen atskillig mer effektiv, og du slipper at hunden gjør andre (uønskede) ting i periodene mellom repetisjonene.

 

3 – Retningsforventning

Retningsforventning innebærer å servere forsterkeren i en spesiell retning, med det formålet å skape en «forventningseffekt» som igjen påvirker hundens adferd i ønsket retning. Det kanskje vanligste eksempelet er å servere godbiten litt ut til venstre under trening av fri ved fot/utgangsstilling. Målet er at hunden etterhvert skal forvente at godbiten kommer ut til venstre fra venstre hånd, slik at den ikke trekker inn foran bena til fører og dermed går skjevt.

Andre vanlige eksempler på retningsforventning er å belønne fremmadsending med å klikke og deretter kaste en ball i hundens fartsretning. Dette vil etterhvert påvirke hundens adferd i en bestemt retning.

Retningsforventning er ofte veldig effektiv for å «finjustere» hundens adferd, og det kan være en fin «shapingsnarvei» i flere situasjoner.

 

4 – Forberede neste ledd i kjeden

Den siste kategorien innebærer å forsterke på en måte som gjør det enklere å legge til neste ledd i kjeden senere. Dette er en forholdsvis uvanlig form for belønningsplassering, men den kan gjerne brukes i enkelte tilfeller.

Et eksempel er fremmadsending til kjegle (der hunden senere skal sendes videre fra kjegla og 25 meter videre til ruta). Man kan da trene selve kjegleutsendingen ved å sette en avstandsbelønning (ball, godbitskål eller lignende) 20-30 meter ut til høyre eller venstre for kjegla. Hunden løper da først til kjegla, og når den får klikk for å stå ved kjegla klikker treneren og sier «værsågod», hvorpå hunden spurter til høyre/venstre for å ta forsterkeren. At hunden er vant til å løpe (fort!) videre etter kjegla kan på en måte forberede hunden på det den senere skal lære, og kanskje spare oss noen ekstra repetisjoner.

Denne typen belønningsplassering bør imidlertid ikke brukes i stedet for å baklengskjede øvelsen skikkelig. Den er først og fremst et supplement som kan brukes av og til, mens mange av repetisjonene også vil foregå med andre typer belønningsplassering.

 

5 – Ingen bestemt belønningsplassering

Dette med belønningsplassering har blitt en så vanlig teknikk å bruke de siste årene at jeg vil slå et slag for en femte kategori belønningsplassering – nemlig «ingen bestemt belønningsplassering». Dette vil si at du klikker for riktig adferd – og deretter belønner «på en eller annen måte», som gjerne varierer fra gang til gang, og som ikke har noen ekstra hensikt bortsett fra å servere forsterkeren til hunden.

En fordel med å belønne «ustrategisk» og variert på denne måten, f.eks. noen ganger ved å kaste godbiten til hunden, andre ganger gi den fra hånden, noen ganger løpe avgårde slik at hunden må ta deg igjen osv osv, er at hunden lærer å utføre adferden i litt varierte situasjoner, og ikke bare når vi kjører en veldig spesifikk form for belønningsservering.

Når du ikke bruker belønningsplassering, tvinger det deg også nødvendigvis til å basere treningen din på presis klikking og fornuftige kriterier – kort sagt god, gammeldags klikkertrening!

 

Variasjon er bra!

Og nettopp dette med å VARIERE er ofte et godt råd når det gjelder belønningsplassering. Tidlig i innlæringsprosessen kan det være lurt å bruke samme type belønningsplassering litt strategisk (for eksempel retningsforventning) for å gjøre selve innlæringen enklere. Men det endelige målet bør være at hunden kan utføre adferden presist uansett hvilken retning forsterkeren kommer fra, så etterhvert kan du gjerne belønne uten noen spesiell retning – eller kanskje til og med bevisst i motsatt retning, for å kvalitetssikre adferden (f.eks. omvendtlokking).

«Klar til neste repetisjon» er noe man med fordel kan bruke veldig mye for å gjøre treningen effektiv. Men husk også å trene adferdene uten at du alltid har plassert hunden med snuten i optimal retning hver eneste gang! Hunden bør f.eks. kunne «gå til musematte» uten at du alltid snur den i optimal retning hver eneste gang – hunden bør også kunne stå med fronten mot deg, og frivillig snu seg 180 grader for å gå til musematte. Så igjen – variasjon er viktig, spesielt når vi er forbi de første stadiene av treningen.

«Belønning i posisjon» er fint å bruke f.eks. mens du lærer hunden å holde en bli-posisjon stabilt, men etterhvert er det også smart å variere med å klikke og la hunden «sprette opp» og ta belønningen. Dette gjør at du får kvalitetssikret f.eks. stimuluskontrollen bedre. Hunden skal jo kunne f.eks. «bli liggende» helt til den får klikk eller beskjed om å reise seg, selv om den «forventer» å sprette opp.

Hvis du alltid trener en bestemt adferd KUN med en bestemt type belønningsplassering, kan du kort sagt risikere at belønningsrutinen din blir en så integrert del av adferden at hunden rett og slett får problemer med å utføre adferden hvis du plutselig forsterker på andre måter (eller evt ikke kan forsterke på en bestemt måte).

Så hovedregelen er «belønningsplassering først for enklere innlæring og bedre presisjon – deretter variasjon for å få best mulig GENERALISERING.

 

Klikket er viktigst!

En annen ting som er veldig viktig hvis du ønsker å klikkertrene effektivt er at du ikke gjør belønningsplasseringen viktigere enn klikket. HOVEDFOKUS bør være på å

  • klikke riktig adferd presist
  • holde arbeidsposisjonen i MINST 0,3 sek etter klikket

Først når disse to er oppfyllt kan du evt belønningsplassere på en bestemt måte for å sette prikken over i´en og få bonuseffekten.

Det som dessverre veldig ofte skjer når hundetrenere blir overdrevent opptatt av belønningsplasseringen er at de

  • Begynner belønningsbevegelsene før/samtidig som klikket (dvs bryter arbeidsposisjonen for tidlig)
  • Klikker upresist

Det som deretter skjer er at klikket rett og slett mister sin effekt, ettersom hunden lærer å se etter treneren sine belønningsbevegelser i stedet for å lytte etter klikket. Resultatet blir en ond sirkel der treneren ikke «stoler på klikkeren» (og kanskje slutter å bruke denne helt), og i stedet begynner å legge enda større vekt på belønningsplassering osv. Og plutselig har man i praksis sluttet å klikkertrene…

Så moralen er: «Gode klikkerbasics først – mens belønningsplassering er (den viktige) kakepynten!»

 

PS: Påmelding til Canis sitt klikkerinstruktørkurs 2019/20 åpnet i går! 20% early bird rabatt ved påmelding før 1. februar. Les mer om instruktørkurset her