Hvorfor skal belønningen være skjult under træning?

Hvorfor skal belønningen være skjult under træning?

Noget af det første jeg lærer mine kursister, er altid at have belønningen godt skjult i lommen når de træner – helt til (mindst 0,5 sek.) efter klikket. Adfærden skal først udføres – først da kommer belønningen frem i lyset!

Der findes (som altid) nogle undtagelser fra denne regel. Men lad mig være meget tydelig: De fleste tilfælde jeg ser hvor trænere holder godbidder eller legetøj synligt i hånden under træning, handler IKKE om bevidste undtagelser fra reglen, men meget mere om regelrette uvaner som træneren har tillagt sig. Desværre ofte på bekostning af langsigtede resultater. Lad mig forklare lidt nærmere…

Når vi træner en bestemt adfærd, træner vi aldrig bare selve adfærden – vi træner altid adfærden i en kontekst. Det er derfor vi altid analyserer både

A – B – C (antecedant – behavior – consequence)

…og ikke bare B, når vi vil forstå en adfærd.

Sagt på en anden måde: Det hjælper ikke at adfærden ser fin ud, hvis den kun forekommer i en helt anden situation end den du egentlig behøver den i! (det er f.eks. ikke tilladt med synlig belønning i konkurrencer…)

En kontekst (situation) består af flere forskellige stimuli (trænerens bevægelser/ord/lyde, synsindtryk og lugte i omgivelserne osv.). Når en adfærd forstærkes under træning, forstærker vi ikke kun adfærden – vi forstærker adfærden i nærvær af bestemte stimuli (Antecedants).

Når en adfærd forstærkes i nærvær af et (eller flere) stimuli, vil disse stimuli hurtigt få stimuluskontrol over adfærden. Stimuluskontrol defineres som at ”adfærden udføres oftere når stimuli X er tilstede, sammenlignet med når stimuli X ikke er tilstede”. Vi tager ikke telefonen når den ikke ringer – kun når den ringer først. Vi tjekker ikke postkassen sent om aftenen (hvis vi har hentet posten tidligere på dagen).

På samme måde er det med synlig vs. usynlig belønning. Hvis en adfærd under indlæring bliver forstærket mange gange når træneren har belønningen synlig i hånden, vil dette være en MEGET fremtrædende stimulus som hurtigt får stimuluskontrol over adfærden. Selvfølgelig kan dette trappes ned efterhånden som træningen går fremad, og jo hurtigere du fjerner den synlige belønning, jo mindre fare for hjælpeafhængighed er der. Så man KAN slippe delvis afsted med lidt sjusk i starten af træningen.

Mit spørgsmål (som er optaget af at optimere hundetræningen mest mulig) er imidlertid: Hvorfor vil nogen bruge mere hjælp end nødvendigt som skal fjernes senere (og som hunden kan blive hjælpeafhængig af) NÅR DET IKKE ER NØDVENDIGT? Det er jo så UTROLIG let at holde belønningen skjult i lommen, og først tage den frem efter klikket?

Eller – er det egentlig så let? Er jeg måske lidt for hurtig her…?

Ved nærmere eftertanke tager jeg måske lidt for let på problemet. Det ER faktisk ikke så enkelt altid at have belønningen skjult i lommen – når man først er blevet vant til at holde den klar i hænderne. Det bliver næsten det samme som at sige at ”det burde være let for en spilleafhængig at bruge pengene på bedre ting end at spille dem op”, eller at ”det burde være let for en alkoholiker at holde sig fra flaskerne”. Så jeg beklager min mangel på empati – jeg indser at det ikke er så enkelt…

Der er to hovedgrunde til at det er så afhængighedsskabende at holde belønningen i hænderne når du først har fået smag for det:

 

1. Det er arbejdsbesparende (og mennesker er som bekendt nogle bekvemmelige dyr). Og jo sjældnere du gemmer belønningen i lommen, jo mere besværligt vil det føles for dig de gange du faktisk gør det rigtigt, eftersom du vil mangle gode mekaniske færdigheder i at tage legetøjet/godbidderne hurtigt op af/ned i lommen. Og jo dårligere mekaniske færdigheder du har i at tage belønningen op/ned, jo mere behageligt vil det føles i stedet for at have belønningen let tilgængelig i hånden.

 

2. Og vigtigst af alt: Jo oftere du går med belønningen synlig, jo bedre vil hunden gå når belønningen er synlig (sammenlignet med når belønningen er skjult). Det at hunden går dårligere end vanligt opleves ofte særdeles ubehageligt for hundetrænere. Det betyder at rigtig adfærd (gemme belønningen i lommen) faktisk bliver straffet de gange den forekommer (din hund træner dig lige så meget som du træner den…). Og samtidig – det at hunden (tilsyneladende) går fint, er ivrig og udfører adfærdene med fart og intensitet, er MEGET forstærkende. Det er som heroin for hundetrænere. Ikke mærkeligt at alle og enhver kan blive afhængige…

 

Hvis du helt fra starten er omhyggelig med altid at have belønningen skjult i lommen, bliver dette ikke noget issue. Når du aldrig har været på stoffer, har du heller ingen problemer med abstinenser. Så vil du have så god flyd på at tage belønningen op af/ned i lommen at du knapt tænker over det – det er bare en helt naturlig del af træningen som går mere eller mindre af sig selv. Og ikke mindst – din hund går nøjagtig lige så godt/ivrigt/intenst med belønningen usynlig – det er jo det den er vant til.

– ”Jamen, jeg får ikke forstærket i rigtig position hvis jeg ikke har belønningen klar i hånden”, tænker du måske.

Jamen, det er derfor vi har KLIKKEREN in the first place! Klikkeren er en ”bridge” mellem øjeblikket hvor du MARKERER rigtig adfærd, og når belønningen bliver serveret 1-3 sekunder senere. Det er akkurat dette klikkeren er lavet til!! Belønningsplacering er noget du kan bruge I TILLÆG til klikkeren, men ikke som erstatning for den.

Men som klikkertræner må du faktisk vove at STOLE PÅ KLIKKEREN. Hvis du er en belønningsplaceringskontrolfreak vil dette være vanskeligt i starten (ikke mindst fordi du sandsynligvis har sjusket så meget med at holde arbejdspositionen efter klikket i flere år, så din hund ikke hører specielt meget efter klikket alligevel). Det er hurtig gjort at havne i dårligt selskab når man først er kommet på afveje.

Men til alle som er afhængige – vid at der findes håb! Det er bare at træffe valget om at du fra nu af skal holde dig ædru og træne mest muligt optimalt (med belønningen skjult). Du bestemmer dig for at tåle at stå i det lille ubehag det indebærer at lære de nye mekaniske færdigheder du har brug for mens det pågår – og om ikke så længe vil du have fået så godt flyd på de nye mekaniske færdigheder at du ikke tænker over det længere.

– ”Men hvad nu hvis vi træner med omvendtlokning – så skal belønningen vel være synlig?» Godt spørgsmål! Jeg skriver mere om omvendtlokning senere 🙂

 

PS: Lidt terpen kan kickstarte de nye gode vaner! Her er et par eksempler på øvelser du kan køre på egen hånd før du tager hunden frem. Start kontrolleret med langsomme bevægelser, vær omhyggelig med at holde hænderne rolige til efter klikket – og lade tempoet øge naturligt efterhånden som dine bevægelser får bedre flyd.