Klikkertræning eller lommetræning

Dette interview med Morten Egtvedt er fra Canis bladet nr. 5 2016. Temaet er fortsat meget aktuelt og vigtigt.

Klikkertræning har oplevet en eksplosiv vækst i de sidste 20 år. Men i et sjældent interview udtaler Canis Grundlægger Morten Egtvedt at han ser mørke skyer i horisonten for klikkertræningens videre udbredelse. Han fortæller at ifølge sikre observationer er klikkertræningen blevet mere en halveret i popularitet de sidste år til fordel for en ny metode som ser ud til at tage hundeverdenen med storm i disse dage.

Journalist: Så hvilken ny metode er der egentlig tale om?

Morten: Tja, det positive er at den nye metode ligner klikkertræning rigtig meget. Strengt taget er den eneste forskel at de bruger en anden adfærdsmarkør end klikkeren.

For nye læsere – hvad er en adfærdsmarkør?

En adfærdsmarkør er en stimulus som trænere bruger til at markere den adfærd de ønsker at forstærke. Den mest præcise adfærdsmarkør er klikkeren. Det er en vældig distinkt lyd som hunden sjældent hører i andre sammenhænge. Når klikkeren efterfølges af belønning i 100% af tilfældene, vil denne lyd være en meget effektiv adfærdsmarkør. Men man kan også bruge andre adfærdsmarkører – et kort og koncist ”dygtig”, en hundefløjte, et lysglimt eller en bestemt berøring, kan også bruges som markør.

Hvad er grunden til at dyretrænere ofte bruger sådanne adfærdsmarkører i træningen?

Det tager lidt tid at få en godbid eller noget legetøj op af lommen og i munden på hunden. I løbet af denne tid er hunden som regel påbegyndt andre adfærd end den vi egentlig ønskede at forstærke. Brugt rigtigt, vil en præcis adfærdsmarkør ”fotografere” rigtig adfærd og fungere som en ”bro” over tidsgabet mellem ønsket adfærd og selve forstærkerleveringen. Det betyder at så længe vi klikker præcist, sker der ingen reduktion i forstærkningseffekten af rigtig adfærd selv om der går et sekund eller to før vi leverer forstærkeren til hunden rent fysisk. Dette er en kæmpe fordel når man træner dyr (mennesker inkluderet). Du kan da formidle præcis forstærkning selv om dyret ikke ser på dig, selv om det er på afstand, og selv om du har belønningen gemt i lommen og det tager et sekund eller to at få den op.

Men nu er der altså kommet en ny træningsmetode som ligner klikkertræning vældig meget. Den bruger altså en anden markør, og ser ud til at tage verden med storm. Bruger denne metode en meget fancy og teknologisk avanceret adfærdsmarkør eftersom den er blevet så populær på så kort tid?

Næh, de fleste som bruger denne metode ved ikke engang hvilen adfærdsmarkør de egentlig bruger. De tror de bruger klikkeren som markør, men det er ikke engang sikkert at deres hund lægger mærke til klik lyden eftersom de allerede har lagt mærke til den anden adfærdsmarkør. Og det at hundetræneren ikke er opmærksom på hvilken markør han egentlig bruger, kan føre til nogen grad af upræcis forstærkning af og til.

Ok, så de forstærker ofte mindre præcist, men alligevel tager denne metode verden med stort?? Det er da noget underligt noget…

Tja, hundetræning går ofte stærkt, og de færreste har gode nok observationsfærdigheder til at lægge mærke til disse små detaljer.

Så du mener at hundeejere har dårligere syn end tidligere?

Nej, observationsfærdigheder drejer sig ikke så meget om hvor gode øjne du har – det handler om at vide hvilke detaljer du skal se efter. Hvis man derimod ved hvad man skal se efter og i tillæg gerne studerer træningen på video, ser man en helt klar tendens. Denne nye metode er i færd med fuldstændig at overtage klikkertræningens plads.

Selv om de som bruger metoden ikke ved at de bruger metoden? Og selv om de som bruger metoden ofte forstærker mere upræcist fordi de ikke er klar over hvilken adfærdsmarkør de egentlig bruger? Det er chokerende!

Ja, det er ikke godt. Men den gode nyhed er at så snart hundetrænere bliver gjort bevidste om sagen og lægger mærke til hvad de gør, så hopper de hurtigt tilbage til klikkertræning igen. Det kræver som regel bare et par ugers rehabilitering med fokus på sagen og så er problemet løst. Af egen erfaring ved jeg imidlertid at tilbagefald kan forekomme, så det er vigtigt kontinuerligt at have fokus på egen trænerfærdigheder.

Så du har også selv prøvet denne metode? Dette var saftige nyheder for hundebladforsiderne!

Ja, når jeg ser gamle film af mig selv, ser jeg at det også skete for mig. Og indimellem når jeg ikke har fået min kop kaffe i tide, kan det fortsat forekomme den dag i dag. Hvad kan jeg sige… det kan tydeligvis ske for selv de bedste trænere.

Men nu må vi ikke holde vores læsere hen i mørke længere – hvad hedder denne nye metode, og hvilken markør er der tale om?

Metoden hedder ”Lommetræning”. Og den adfærdsmarkør som bruges, er ”at bevæge belønningshånden mod lommen”. Deraf ”Lommetræning”.

At bevæge hånden mod lommen? Er det virkelig en adfærdsmarkør?

Alle stimuli som pålideligt varsler levering af forstærker, vil fungere som adfærdsmarkører. Det kaldes også for ”sekundær forstærker”. Og hvis du tænker dig om, så ser du hurtigt at næsten ingenting varsler levering af forstærkning mere pålideligt en hundetrænerens hånd der bevæger sig mod lommen…

Hmm, interessant. Men disse hundetrænere bruger som regel fortsat klikkeren eller ordet ”dygtig” i tillæg? Vil dette ikke være meget tydeligere for hunden end hånden der begynder at bevæge sig som lommen?

Når vi snakker om betingning, er det af mindre betydning hvor ”tydelig” de forskellige stimuli er. Det som er vigtigt, er rækkefølgen.

På hvilken måde?

Det som er den evolutionære årsag til at klassisk betingning som indlæringsprincip er opstået, er at individer som lærer at visse stimuli varsler om vigtige hændelser (dvs gode ting eller farlige ting), vil have en selektionsmæssig fordel fremfor individer som ikke lærer denne kobling lige så let. Klassisk betingning indebærer enkelt forklaret at visse stimuli som i udgangspunktet er neutrale, får signalværdi ved at det gentagne gange bliver ”parret” med ”den vigtige hændelse”. Klikket får signalværdi fordi det varsler at mad eller morsomme ting er på vej. Raslen i buskene kan få signalværdi der varsler at en løve snart springer frem.

Æh… ok?

Men du forstår sikkert at rækkefølgen er af væsentlig betydning i denne læringsproces. Hvis hunden får godbidden først, og først bagefter hører klikket, vil klikket ikke få signalværdi. Hunden har jo allerede fået maden. Og hvis lyden af raslen i buskene først kommer samtidig med at løven satte sine klør i din mås, ville denne lyd ikke have den store signalværdi heller.

Nej, det lyder logisk. Så du mener ikke engang at det hjælper at lyden kommer samtidig med den vigtige hændelse? Sker der heller ingen læring der?

Der er særdeles små evolutionære fordele forbundet med bagklogskab for en antilope som har en sulten løve hængende i måsen.

Ok, så det betyder altså at klikket må komme FØR maden for at den skal have nogen signalværdi?

Det er korrekt. Men helst ikke lige før. Forsøg har faktisk vist at betingning sker mere effektivt hvis afstanden mellem ”stimulus” (f.eks. klik) og ”vigtig hændelse” er større end 0,3 sekund. Og mindre effektivt hvis denne afstand er minde en 0,3 sekund.

Så det er bedre at hunden får belønningen 0,4 sekund eller mere efter kikket, end at maden er i munden på hunden 0,1 sekund efter klikket?

Ja, mindst 0,4 ser ud til at give stærkere betingning. Dette er også logisk i evolutionær sammenhæng. Hvis du lærer sammenhængen mellem visse stimuli som varsler vigtige hændelser med mindst 0,4 sek., har du faktisk tid til at gøre noget som øger chancerne for overlevelse i dette tidsrum – som for eksempel at få 3 meters forspring fra løven, eller starte udskillelse af spyt i munden for at fordøje godbidden bedre. 0,1 sekunds varslingstid er væsentligt mindre nyttigt i praksis, og det kan derfor se ud som om kroppen ikke ser værdien i at lære dette lige så effektivt.

Ok, men lad os undgå at blive alt for filosofiske, og hellere holde os til praktisk hundetræning. Jegforstår at det er vigtigt at forsinke belønningslevering med ca. 0,4 sek. Efter klikket for optimal betingning af klikket. Men jeg forstår ikke hvad

dette har at gøre med at den nye træningsmetode – var det ”lommetræning” det kaldte den – er i færd med at overtage verden?

Jo, lad os gå tilbage til busken med løven bagved – jeg lover at komme til pointen, så bare vær tålmodig. Forstil dig nu en antilope som 20 gange har hørt lyde bag busken og 20 gange undsluppet løven 1 sekund før den hoppede frem. For denne antilope, kan du sikkert tænke dig at ”lyd i busk” har temmelig høj signalværdi.

Jo, jeg kan god tænke mig nogle sammenlignelige scenarier fra mit eget liv…

Ja, ikke sandt. Ok, forestil dig nu at det rabler for løverne, og de pludselig begynder på en helt ny jagtteknik. Først kommer der en lyd fra busken de har gemt sig bag (akkurat som før), men lige efter denne lyd holder løven et stort rødt skilt op hvor der står: ”Nu kommer jeg og tager dig! ”. Først et halvt sekund efter at have vist skiltet, springer løven frem for at tage antilopen. Og så er spørgsmålet: Tror du at antilopen lærer sammenhængen mellem det store røde skilt og løver som springer frem fra buske?

Tja, skiltet var jo meget tydeligt…

Ja, måske er skiltet tydeligt – men det har absolut nul signalværdi. Antilopen ved allerede at løven venter bag busken, eftersom den hørte lyden først. At løven derefter holder et stort rødt skilt op i tillæg, giver ingen ny information til antilopen, og der vil derfor ikke ske nogen effektiv betingning i forhold til skiltet.

Jamen hvad har dette med hundetræning at gøre?

Det lommetrænere gør (som de ikke ved de gør), er at når de klikker (eller siger ”dygtig”), har de allerede signaleret til hunden at ”belønningen er på vej” ved at bevæge hånden mod belønningslommen. At de efterfølgende klikker ”eller siger ”dygtig”) i tillæg, bliver det samme som at løven holder et værdiløst skilt op når antilopen allerede ved hvad der kommer.

Aha, nu begynder brikkerne at falde på plads.

Så hvis du forestiller dig at du har en hund som er blevet ”lommetrænet” et stykke tid… hvilken stimulus vil du så se efter? Klikket eller håndbevægelsen?

Håndbevægelsen selvfølgelig.

Netop. Og jo mere lommetræning hunden erfarer, jo stærkere bliver ”lommetræningsbevægelserne” som betinget forstærker – mens klikkeren bliver desto mindre vigtig. I de værste tilfælde ser man hunde som ikke længere reagerer på klikkeren i det hele taget hvis de for eksempel er på afstand med ryggen mod fører og ikke kan se bevægelserne fra hundefører.

Er det rigtig at sige at lommebevægelserne ”blokerer” for klikket?

Det er præcis det der sker.

Så der kan faktisk være en hel mængde klikkertrænere derude som klikkertræner sine hunde, men hvor hundene ikke længere ved hvad klikket betyder?

Nja, en vis betingningseffekt mellem klik og belønning vil altid ske eftersom hunden ofte får klik (og derefter belønning) mens de har ryggen til hudetræneren og derfor ikke ser belønningsbevægelserne. Men det er helt klart at mange klikkertrænere bruger klikkeren på en måde som definitivt ikke giver dem det fulde udbytte af dens potentiale.

Men dette kunne fikses ganske enkelt, nævnte du tidligere?

Ja, og første skridt er bare at blive opmærksom på sagen, sådan som læserne af denne artikel allerede er. Så kan man i en periode være meget bevidst om at hold arbejdspositionen til efter klikket.

Hvad mener du med at ”holde arbejdspositionen”?

”At holde arbejdspositionen” vil sige at du ikke gør noget som fortæller hunden at belønningen er på vej, før 0,3 sek. efter at du har klikket. At holde arbejdspositionen kan indebære at du står stille med hænderne ned langs siden, og først efter at du har klikket, begynder du på bevægelsen som fortæller hunden at du er i færd med at belønne. Hvis du for eksempel træner fri ved for, står du af forskellige årsager ikke stille, så da vil det at holde arbejdspositionen indebære at du går fremad sådan som du altid gør i fri ved fod frem til du klikker – og gerne mindst et eller to ekstra skridt efter klikket – før du stopper og begynder belønningsrutinen.

OK, så det er altså meget vigtigt altid at holde arbejdspositionen i mindst 0,3 sek. efter klikket?

Det er ikke vigtigt sammenlignet med verdens miljøproblemer eller at FCK vinder superligaen, men i hundetræningssammenhæng er det ekstremt vigtigt. I hvert fald så længe du ønsker at klikkertræne effektivt – og ikke ubevidst havne i lommetræningsstatistikken.

Det må jeg sige… -det var interessante nyheder. Hvordan kan dette have fået lov at udvikle så tilpas ubemærket i et så stort omfang?

Det bliver selvfølgelig bare til spekulationer, men jeg tror meget hænger sammen med at mange hundetrænere i de sidste år har lagt mere og mere vægt på altid at belønne hunden i en speciel position. Det er ikke længere nok at klikke rigtig adfærd – hunden skal død og pine også belønnes i akkurat denne position. Og det er klart at når hunden absolut skal belønnes i samme position som den er i når klikket kommer, bliver det vigtigt at få belønningen lynhurtigt op af lommen. Derfor begynder hundetræneren belønningsbevægelsen gradvis tidligere og tidligere. Efterhånden bliver det så ilde at de ikke engang tør have belønningen gemt i lommen, og går altid med den klar i hånden som en slags sutteklud i stedet.

Var det ikke Bob Bailey som sagde: ”Click for action – treat for position”?

Jo, det stemmer. ”Click for action – THEN treat for position”. Det kan være nyttigt at belønne i en bestemt retning / position efter at du først har klikket for korrekt udført adfærd. Men det skal ikke gøres i samme operation! Klik først – SÅ belønner du evt. i en bestemt position. Det er vigtigt at træneren tør stole på klikket. Belønningsplaceringen er kun en bonus. For mange er det desværre blevet stik modsat. Og eftersom klassisk betingning ikke virker baglæns, vil klikkeren nødvendigvis få mindre og mindre effekt – hvilket igen vil føre til at træneren føler at hurtig belønningslevering og en speciel belønningsplacering bliver vigtigere og vigtigere. Det bliver en selvforstærkende ond cirkel.

Du beder altså hundetrænerne lægge mindre vægt på belønningsplacering?

Jeg siger at hvis folk vil klikkertræne, så skal de stole på klikket! Jeg beder ikke folk lægge mindre vægt på belønningsplacering – jeg beder dem lægge enormt stor vægt på klikket – og i tillæg bruge forskellige former for belønningsplacering som prikken over i ét. Med god klikkertræning kan du få begge dele. Du kan markere ønsket adfærd uhyre præcist, du holder arbejdspositionen i mindst 0,3 sek. efter klikket – og SÅ kan du placere belønningen akkurat der hvor det passer bedst til akkurat den adfærd. Og for guds skyld – hold op med at have tvangstanker omkring hvad hunden gøre eller ikke gør mellem klikket og levering af belønning. Og HVIS det er vigtigt hvad hunden gør, så LÆR hunden at ”fryse” (bliv i positionen) efter klikket når ud træner akkurat denne adfærd.

Jeg takker for snakken, Egtvedt. Jeg forstår ud er en travl mand ofr tiden. Har du nogen råd til lommetrænere som ønsker at blive rehabiliteret?

Ja, det har jeg. Første skridt er at indrømme overfor sig selv at man (helt uforskyldt selvfølgelig) er blevet en lommetræner. Hvis man ser sig selv træne på video, ser man det sort på hvidt, og det er som regel en effektiv opvågning. Andet skridt er at begynde at indøve et nyt bevægelsesmønster. Tænk på at begge dine hænder skal være limet til siden på låret når du klikker, og derefter en lille tanke længere før du begynder på belønningsbevægelsen. Du kan gerne tørtræne uden hund og virkelig overdrive denne pause (i 1-2 sekunder) mens du er tidligt i rehabiliteringsfasen. Og hold belønningen skjult i lommen til enhver tid under træning – undtaget selvfølgelig når ud faktisk belønner. Tredje skridt er kontinuerlig årvågenhed, så du ikke glider tilbage til gamle vaner. At se sig selv træne på video med jævne mellemrum eller få en træningskammerat til at observere din træning og tælle antal korrekte og fejl responser, kan være nyttigt. Fjerde kridt behøver du ikke tænke på – når ud har trænet med rigtige bevægelser over længere tid, vil du udvikle flyd på de nye bevægelser og så går tingene af sig selv. Så er du klikkertræner for altid.