Tanker om det at vælge mellem belønninger

I mandags delte jeg en lille video på vores facebookside af mine hunde der vælger hvilken belønning de helst vil have. De vælger ved at træde på et target der giver en bestemt belønning: Leg eller godbid. Jeg har fået en del kommentarer og spørgsmål omkring træningen og tolkningen af det. Tak for det! Det har fået mig til at tænke over hvad man egentlig kan få af informationer og hvordan det hænger sammen med indlæring.

Baggrunden

For et par år siden forsøgte jeg bare for sjov at lære hundene at når de satte pote på en target gav det en godbid, men hvis de satte poten på en anden target gav det leg.

Inspirationen, den første træning og indlæring kan du se i dette indlæg: https://canishundeskole.no/da/vil-du-helst-have-legetoej-eller-godbid/?fbclid=IwAR3hw1zHDYmDpRgSaRkn2uMRYXP09D0YppJHMMuL9aoCXXmrnDx9XZURzu0

I løbet af de sidste to år har for sjov jeg taget det op nogle gange, jeg har lavet mine egne regler: gul, rund target giver altid godbid, blå firkantet target giver altid leg. Inden jeg går i gang med at “spørge” hunden hvilken belønning den vil have, fortæller jeg den hvad den kan få ved at lave et par gentagelser med kun det ene target tilstede. Igennem et træningspas af denne type får hunden altid samme godbid og samme legetøj, så der er 100% forudsigelighed.

Jeg har sat et signal på det at vælge, så hunden skal udføre en øvelse, den får signal til at vælge – klik og den belønning hunden har valgt.

Det jeg har fået ud af min lille vælg-selv-leg er, at Freddy som er en madglad labrador stort set altid vælger leg som belønning og at Simba som elsker genstande, veksler mellem leg og godbidder. Det overrasker mig lidt og jeg kan ikke forklare det.

I dette indlæg er der tre lange videoer. Først to af et setup, hvor jeg troede, at begge hunde ville vælge godbidden: godbidden er frikadeller, som begge hunde elsker og legetøjet er et “kedeligt” fleecetov. Hundene valgte ikke godbidderne som jeg havde regnet med, men i stedet valgte de legetøjet de fleste gange.

I den sidste video forsøger jeg at gøre leveringen af godbidder lige så entusiastisk som leveringen af legetøj, for at se om det ændrer på hundens præference.

Videoerne er af tre uafhængige træninngspas og det hele er med – derfor er de lidt lange (har dog speedet noget af det lidt op).

Selv om jeg forsøger at tolke noget ud fra nogle enkelte træningspas skal jeg nævne, at dette på ingen måde er en videnskabelig undersøgelse. Jeg forsøger at besvare for mange spørgsmål med for lidt data og jeg er på ingen måde konsistent i det jeg gør i træningen: Hvor hunden er placeret i forhold til targets, hvilke øvelser jeg laver inden de skal vælge osv er forskelligt og ikke gennemtænkt.

Vælger hunden den target der er forstærket flest gange?

Jeg har observeret, at hunden i et træningspas ofte vælger den samme target. Det kan være fordi den  target er blevet forstærket mest. Hvis hunden første gang vælger fx lege-target, bliver det at træde på den target forstærket og dermed mere sandsynlig næste gang. Samtidig bliver det mindre sandsynligt at hunden vælger den anden target.

Det jeg gør er at jeg inden hvert pas af denne type, “indkører” de to targets med de belønninger de giver i dette pas. Det gør jeg ved kun at have den ene target tilstede, hunden løber til den og får den tilhørrende forstærker, ca 3-5 gange med hver forstærker. Jeg prøver også at skifte, så det ikke altid er den samme target jeg slutter med. Så begge targets bliver forstærket lige mange gange hver for sig, inden hundene begynder at skulle vælge.

I dagens træningspas med Freddy valgte han de første gange den blå lege-target. Midt i træningspasset (ca 2:33 i videoen nedenfor) vælger jeg at fjerne den blå target og jeg laver et par gentagelser, hvor han kun kan vælge den anden (gul godbid). Første gang efter kun den gule target har været fremme, vælger han den blå. Derefter går han på den gule target, mens jeg giver  signal til en anden øvelse og det giver derfor ingen klik+godbid. I gentagelsen lige efter kan jeg faktisk ikke se om han går til den gule eller blå (det ser ud som om han går mod den blå, men sætter pote på den gule), jeg vælger at forstærke med godbidder. Gangen efter vælger han uden tvivl den blå (leg). I det tilfælde har han netop fået 3 godbidsforstærkninger og 1 lege-forstærkning. Kan man ud fra det tolke på om hunden vælger ud fra hvilken type forstærker den får eller om det stadig handler om hvad der er forstærket mest gennem tiden? Jeg ved det ikke 🙂

Kan hunden se og finde de to targets?

En anden overvejelse har været om de lettere kan se den blå target (for det er den de begge vælger oftest). Jeg ved at hunde ser blå farve godt, men da tæppet er i en blå/lille nuance forestiller jeg mig at de også kan se den gule, da den er lysere. Jeg har brugt en app der skulle vise hvordan hunde ser farver og lys og først vi videoen herunder er der et billede af de to targets, som vi ser dem og derefter som hunden (formentlig) ser dem. Umiddelbart vil jeg sige at hunden på det underlag kan se begge targets udmærket.

 

Jeg har også overvejet om placeringen har noget at sige, om hunden bare vælger den der er nærmest. I videoen med Simba flytter jeg lidt rundt på tagets, bytter om på dem og faktisk kan det godt se ud som om han vælger den der er nærmest. Jeg kan ikke afgøre det ud fra dette træningspas. Men hvor Freddy aldrig vælger godbidder hver gang i et helt træningspas, kan Simba godt finde på det, så måske vil Simba bare lige gerne have godbidder som leg?

 

Hvad vælger hunden hvis belønningen er synlig?

Jeg har fået spørgsmålet: Hvad ville hundene gøre hvis der var tale om to synlige belønninger – altså lav en øvelse – klik og vælg mellem leg og godbid. Mit gæt var at de ville vælge godbidden, nu har jeg prøvet det og det er det der sker: i 9 ud af 9 tilfælde vælger de godbidden, selv om legetøjet ligger lige ved siden af (det kan ses først og efter 4:07 i den øverste video med Freddy og først i videoen med Simba nedenfor).

Jeg kan ikke forklare hvad forskellen er på om hunden kan se belønningen eller om den kan vælge en target og så få den? Er det ene et mere frit valg end det andet? Er det fordi legetøjet mest er noget værd når jeg har fat i den anden ende og godbidden har en værdi i sig selv?

Det er påfaldende at begge hunde vælger godbidden hver gang når de er synlige og primært vælger legetøj når belønningen ikke er synlig.

Jeg kunne godt tænke mig at teste forskellige godbidder, så jeg havde en god en dårlig godbid med hver deres target tilknyttet. Jeg tænker at det ville give mig et bedre svar på om hundene har forstået legen eller om de bare elsker den blå target.

 

 

 

Hvad betyder serveringen af belønningen?

Jeg har også fået et spørgsmål om hvad det betyder at jeg er meget mere entusiastisk og deltagende i legen end i godbidsspisningen og om billedet vil ændre sig, hvis jeg mønstrede samme entusiasme ved begge belønninger. I min almindelige træning giver jeg ofte godbid (uden særlig entusiasme) 5-10 gange og så veksler jeg med leg. Jeg vil gerne have at mine hunde kan lege de steder hvor vi skal træne og da de kan det bruger jeg sjælden at lege med godbidder.

Men jeg prøvede det alligevel: gul target giver entusiastisk lege-godbid og blå giver leg med fleecetov. Jeg forsøget at tone entusiasmen op for godbidsbelønning og ned for legebelønning og at gøre lege-passene lidt kortere. Det lykkedes ikke helt, legen er stadig længere end godbidsleveringerne, men de er mere lige i entusiasme og tid end tidligere.

Resultatet blev at Freddy valgte 6 gange legetøj og 6 gange entusiastisk godbid! Så det ser ud som om serveringen betyder noget – hvilket jeg også havde ventet. Synes også det tyder på at Freddy faktisk forstår legen og ikke bare altid vælger den blå target fordi den er forstærket mest.

 

 

 

Hvad tænker du? Tolkninger, kommentarer, videnskabeligt arbejde på området (har kigget, men ikke fundet noget der passer) og forslag til nye setups er meget velkomne 🙂