Belöningsplacering

Belöningsplacering

Det viktigaste är att klicka exakt när hunden utför beteendet korrekt. I många situationer kan du emellertid effektivisera träningen ytterligare genom att servera förstärkaren på ett särskilt sätt efter klicket.

I stort sett finns det 4 olika kategorier av ”belöningsplacering”. Exempel på alla dessa kan du se utföras i praktiken i den lilla onlinekursen på Canisakademin.se

Här kommer en kort beskrivning av de fyra kategorierna (pluss en ”bonuskategori”!)

 

1 – Belöning i position (”room service”)

Med det menas att servera förstärkaren medan hunden förblir i den position som den befinner sig i när du klickade (istället för att komma till dig när du klickar). Detta är ett vanligt sätt att förstärka på, t ex när du tränar ”ligg”.  Vi klickar då när hunden lägger sig, och serverar förstärkaren medan hunden fortfarande ligger.

Om vi tränar framåtsändande till rutan, kan ”belöning i position” innebära att vi klickar just när hunden springer ut till rätt punkt inne i rutan, och att vi därefter springer fram till hunden och belönar inne i rutan, eller eventuellt kastar en boll direkt till hunden.

Syftet med den här typen av belöningsplacering är på sätt och vis att få ”2 beteenden till priset av 1 förstärkare”. Vi förstärker själva det beteende som vi tränar (t ex ligg) med klicket, och förstärker dessutom ”ligg kvar i samma position” med sättet vi serverar förstärkaren på.

 

2 – Redo för nästa repetition

Den här typen av belöningsplacering innebär att vi klickar för rätt beteende, och att vi därefter använder förstärkaren till att manövrera hunden i rätt position inför nästa repetition. Detta kan innebära att vi leker med hunden samtidigt som vi förflyttar oss till nästa startpunkt. Det kan även innebära att vi serverar godbiten så att vi vänder hundens huvud i rätt riktning, så att det är enkelt för hunden att starta nästa repetition så fort den har svalt godbiten.

Ibland kan ”redo för nästa repetition” och ”Belöning i position” vara samma sak. Om du t ex tränar ”Ligg kvar”, kan du belöna medan hunden ligger. Detta är ”room service”, men samtidigt är det också ”redo för nästa repetition”, eftersom hunden även ska starta nästa repetition liggande på samma ställe. Det samma gäller t ex när du tränar vändningar på stället under fritt följ.

Syftet med den här typen av belöningsplacering är att minska dötiden och få bättre ”flyt” i träningen. När hunden hela tiden växlar mellan förstärkning – arbete – förstärkning (utan dötid och onödig förflyttning där emellan), blir träningen åtskilligt effektivare, och du slipper få en hund som gör andra (oönskade) saker i perioderna mellan repetitionerna.

 

3 – Riktningsförväntan

Riktningsförväntan innebär att servera förstärkaren i en speciell riktning, med det som avsikt att skapa en ”förväntanseffekt” som i sin tur påverkar hundens beteende i önskad riktning. Det kanske vanligaste exemplet är att servera godbiten lite ut till vänster under träning av fritt följ/utgångsställning. Målet är att hunden efterhand ska förvänta sig att godbiten kommer ut till vänster från vänstra handen, så att den inte drar sig in framför förarens ben och därmed går snett.

Andra vanliga exempel på riktningsförväntan är att belöna framåtsändande genom att klicka och därefter kasta en boll i hundens färdriktning. Detta påverkar efterhand hundens beteende i en bestämd riktning.

Riktningsförväntan är ofta väldigt effektivt för att ”finjustera” hundens beteende, och det kan vara en bra “shaping-genväg” i flera situationer.

 

4 – Förbereda nästa led i kedjan

Den sista kategorin innebär att förstärka på ett sätt som gör det lättare att sedan lägga till nästa led i kedjan. Detta är en förhållandevis ovanlig form av belöningsplacering, men den kan gärna användas i enstaka fall.

Ett exempel är framåtsändande till kon (där hunden sedan ska skickas vidare från konen och 25 meter vidare till rutan). Man kan då träna själva utskicket till konen genom att sätta en avståndsbelöning (boll, godisskål el.dyl.) 20-30 meter ut till höger eller vänster om konen. Hunden springer då först till konen, och när den får klick för att stå vid konen, klickar tränaren och säger ”varsågod”, varpå hunden spurtar till höger/vänster för att ta förstärkaren. Att hunden är van vid att springa (snabbt!) vidare efter konen kan på sätt och vis förbereda hunden på det den ska lära sig senare, och kanske bespara oss några extra repetitioner.

Den här typen av belöningsplacering bör emellertid inte användas istället för att baklängeskedja övningen ordentligt. Den är först och främst ett supplement som kan användas lite då och då, medan många av repetitionerna även försiggår med andra typer av belöningsplacering.

 

5 – Ingen bestämd belöningsplacering

Det här med belöningsplacering har blivit en så vanlig teknik att använda de senaste åren att jag vill slå ett slag för en femte kategori av belöningsplacering – nämligen ”ingen bestämd belöningsplacering”. Det betyder med andra ord att du klickar för rätt beteende – och därefter belönar ”på ett eller annat sätt”, som gärna varierar från gång till gång, och som inte har någon extra avsikt utöver det att servera förstärkaren till hunden.

En fördel med att belöna ”ostrategiskt” och varierat på det här sättet, t ex några gånger genom att kasta godbiten till hunden, andra gånger ge den från handen, några gånger springa iväg så att hunden måste komma ikapp dig, osv, osv, är att hunden lär sig att utföra beteenden i lite varierande situationer, och inte bara när vi kör en väldigt specifik form av belöningsservering.

När du inte använder belöningsplacering, tvingar det dig nödvändigtvis att basera din träning på exakt klickande och förnuftiga kriterier – kort sagt god, gammaldags klickerträning!

 

Variation är bra!

Och just detta med att VARIERA är ofta ett gott råd när det gäller belöningsplacering. Tidigt under inlärningsprocessen kan det vara smart att använda samma typ av belöningsplacering på ett strategiskt sätt (t ex riktningsförväntan) för att göra själva inlärningen enklare. Men det slutgiltiga målet bör vara att hunden kan utföra beteendet exakt, oavsett från vilken riktning förstärkaren kommer, så efterhand kan du gärna belöna utan någon särskild riktning – eller kanske till och med medvetet i motsatt riktning – för att kvalitetssäkra beteendet (t ex omvänt lockande).

”Redo för nästa repetition” är något man med fördel kan använda väldigt mycket för att göra träningen effektiv. Men kom ihåg att även träna beteendena utan att du alltid har placerat hunden med nosen i optimal riktning varenda gång! Hunden bör även kunna stå med fronten mot dig och frivilligt vända sig 180 grader för att gå till musmattan. Så åter igen – variation är viktigt, särskilt när vi har kommit förbi de första stadierna av träningen.

”Belöning i position” är bra att använda, t ex medan du lär hunden att hålla en stanna-position stabilt, men efterhand är det även klokt att variera med att klicka och låta hunden ”studsa upp” och ta belöningen. Detta gör att du får kvalitetssäkrat t ex stimuluskontrollen bättre. Hunden ska ju kunna t ex ”ligga kvar” enda tills den får klick eller besked om att sätta sig upp, även om den ”förväntar sig” att studsa upp.

Om du alltid tränar ett bestämt beteende ENDAST med en bestämd typ av belöningsplacering, kan du kort sagt riskera att din belöningsrutin blir en så integrerad del av beteendet att hunden helt enkelt får problem med att utföra beteendet om du plötsligt förstärker på andra sätt (eller eventuellt inte kan förstärka på ett bestämt sätt).

Så huvudregeln är ”belöningsplacering först för enklare inlärning och bättre precision – därefter variation för att få bästa möjliga ”GENERALISERING”.

 

Klicket är viktigast!

En annan sak som är väldigt viktigt om du vill klickerträna effektivt, är att du inte gör belöningsplaceringen viktigare än klicket. HUVUDFOKUS bör vara att

  • klicka exakt för rätt beteende
  • hålla arbetspositionen i MINST 0,3 sekunder efter klicket

Först när dessa två har uppfyllts kan du eventuellt belöningsplacera på ett bestämt sätt för att sätta pricken över i´et och få bonuseffekten.

Det som tyvärr sker väldigt ofta när hundtränare blir överdrivet upptagna av belöningsplaceringen är att de

  • börjar belöningsrörelserna innan/samtidigt som klicket (d.v.s. bryter arbetspositionen för tidigt)
  • klickar oprecist

Det som därefter sker är att klicket helt enkelt förlorar sin effekt, eftersom hunden lär sig att titta efter tränarens belöningsrörelser istället för att lyssna efter klicket. Resultatet blir en ond cirkel där tränaren inte ”litar på klickern” (och kanske slutar använda den helt), och istället börjar lägga ännu större vikt vid belöningsplacering osv. Och plötsligt har man i praktiken slutat klickerträna…

Så moralen är: ”Bra klickerbasics först – medan belöningsplacering är (den viktiga) dekorationen!”

 

PS: Canis´klickerinstruktörskurs 2019/20 har nu öppnat för anmälan! 20 % Early Bird rabatt vid anmälan före 1 februari. Läs mer om instruktörskursen här