Att tackla att göra fel

Jag fick nya Canis i brevlådan här om dagen och läste en intressant artikel av Morten om hur klickerhundar lär sig att hantera fel i träningen. Åsa har också skrivit en bra blogg om samma ämne. Jag tänkte skriva ner lite lösa tankar som jag har om ämnet, som jag tycker är ganska komplext att förklara i text. Framför allt tänkte jag diskutera kring vad man gör när hunden gör fel. Jag håller med om det mesta som står i artikeln, men tänkte presentera mina tankar.

I artikeln presenteras tre olika sätt att hantera när hunden gör fel. Man kan hålla tillbaka klicket, stå helt lugnt och vänta tills hunden självständigt erbjuder beteendet igen innan man klickar och belönar. Man kan hålla tillbaka klicket och dessutom köra en time out (en period där hunden inte längre har möjlighet att uppnå belöning) innan hunden åter får försöka utföra hela beteendet. Den får endast belöning om den gör allt perfekt vid första försöket. Den tredje varianten är att hålla tillbaka klicket, och därefter hjälpa hunden att göra rätt genom att visa hunden, flytta på sig eller göra det lite lättare för hunden på andra sätt.

Jag tycker att alla tre varianterna har sin plats i träningen, alternativ tre mindre ofta än de andra (eftersom hjälp som regel är förstärkande och dessutom skapar en passiv hund). Alternativ ett blir ofta naturligt i starten av träningen, när man shejpar fram nya beteenden. Hunden lär sig att en utebliven belöning inte är någon stor sak och att det bara är att försöka igen och igen tills belöningen kommer. Under tiden bygger du massor med värde för rätt beteende. Det här är ett riktigt bra val, så länge man hela tiden ser att träningen går framåt och hunden blir duktigare. I all träning är utvärdering väldigt viktig, om du inte får framgång måste någonting ändras. Det är långt ifrån säkert att det är felrutinen som behöver förändras om det inte går som du har tänkt, ofta handlar det om andra saker.

Den andra varianten av felhantering bygger på att hunden får en liten time out när det blir fel. En time out är en tidsperiod där hunden inte har chans till belöning. Ordet time out har fått en ganska negativ klang (man tänker sig kanske att hunden får sitta i skamvrån) men det är inte några utvisningar jag pratar om här. För att en time out ska ha en bra effekt måste det finnas en stark förstärkningshistoria – hunden ska både kunna och vilja utföra beteendet. För att nå dit måste man nästan ha en period av alternativ ett, där hunden spontant utför beteendet igen efter en misslyckad repetition. Det är också viktigt att man lyckas skapa den känsla man vill ha hos hunden i time outen. I de flesta fall vill man väcka en känsla av jävlar anamma – ”det där ska du minsann inte lura mig till igen!”, men absolut inte en känsla av uppgivenhet eller besvikelse.

En sak som har blivit mer och mer tydlig för mig är att hundträning handlar om att skapa rätt känsla. Alla konsekvenser (belöning och straff) är kopplade till en känsla, men de känslorna har nyanser. Att hitta rätt känsla i både belöning och eventuella straff är till stor del nyckeln till framgångsrik hundträning. En belöning är aldrig någonting mer än känslan den skapar. På samma sätt gäller det att hitta rätt känsla i en time out. Om time outen skapar en känsla av uppgivenhet eller besvikelse så har man inte hittat rätt. För en del hundar kommer rätt känsla automatiskt, med andra hundar måste man jobba fram den känslan. Precis som när det gäller belöningar. En del hundar har automatiskt lyckliga och glada känslor när du kastar en leksak, med andra hundar måste du jobba hårt för att odla den känslan. Och en sak är säker – om man inte har rätt känsla i belöningen, lär man inte hitta rätt känsla i time outen.

Att ha en hund som kan hantera time outer på ett bra sätt är en stor tillgång i träningen. Därför tycker jag att det är värt att jobba för att hitta rätt känsla när man felar hunden. Squid är en hund som har lärt mig mycket om det. Hon blev lätt passiv och uppgiven om hon fick någon typ av time out (men hade inga problem med att försöka igen om hon bara inte fick belöning). Till viss del hängde det ihop med känslan för belöningarna, men också med ett generellt personlighetsdrag.

För att kunna använda en time out effektivt behövs:

Rätt känsla i belöningen
En hund som både kan och vill upprepa beteendet (en hög lyckandeprocent)
En hund som spontant upprepar beteendet (gärna med högre intensitet) om belöningen uteblir
Rätt känsla i time outen

Exempel på time outer jag använder

Om hunden blir lös i greppet om apporten stjäl jag apporten från hunden och låter hunden tigga för att få tillbaka den. Det här börjar jag med relativt tidigt i träningen, men den goda grundträningen gör att jag sällan behöver göra det många gånger. Hunden känner också igen ritualen från lek, där jag kan stjäla leksaken från hunden och ha den för mig själv tills hunden tigger för att få den tillbaka igen.
I störningsträning med en erfaren hund. Det gäller framför allt olika typer av stadgepositioner – fotgående, sitt/ligg/stå, nosduttar etc. I början får hunden gärna titta på störningen och får belöning när han engagerar sig i beteendet igen. Med valpar och unga hundar går jag bara ifrån dem om de tappar fokus under fotgående, och belönar så fort de tar kontakt igen. När de blir mer erfarna kan jag ta dem ur positionen om de gör fel och låta dem göra om hela beteendet på nytt med samma störning.
Utgångsställning. Under en kort period kan hunden få rätta in sig själv om han hamnar fel i utgångsställning eller halt. Jag försöker framför allt att gå igenom den fasen medan hunden fortfarande jobbar stående vid sidan. Det ger ofta hunden en bra känsla av vilken punkt som är rätt. Lite senare i träningen, när jag lägger på sitt vid sidan, låter jag för det mesta hunden göra om hela beteendet för att få belöningen. Det finns två anledningar till det. Det ena är att hunden lätt gör en vana av att sätta sig snett och sedan rätt sig in. Det andra är att jag vill att hunden ska känna sig säker på att det är rätt om jag står helt stilla och inte bekräftar hunden när han sitter vid sidan, annars riskerar man att hunden börjar prova lite olika varianter om det tar för lång tid innan belöningen. Det här är mina erfarenheter, som alltid måste man utvärdera träningen. Om hunden stadigt blir bättre trots att man inte avbryter OCH om hunden är stensäker på att det är rätt när han väl sitter rätt – då behövs ingen time out.

Det finns massor mer att skriva om ämnet, men nu måste jag ut i solen och mata får och träna hund! Kom gärna med era tankar i kommentarsfältet!

12 svar på ”Att tackla att göra fel”

Mari & Micke den 5 november 2010 kl. 14:54 skrev:

Kloke ord!

Liker måten du bruker time out på. Det skal ikke gjøre hunden lei seg, men der i mot tenne den til å gjøre et bedre forsøk.

Svara ↓
Åsa den 6 november 2010 kl. 08:16 skrev:

Lite att tänka på! Jag har alltid förstått ”time-out” som att man faktiskt avlägsnar hunden från platsen (binder upp, sätter i bilen), att direkt göra om beteendet från början ser jag som en följd av en felsignal. Det är problemet när man skriver om saker och inte kan visa och prata samtidigt – olika ord betyder olika hos olika människor. Jag tycker att ämnet är intressant!

Svara ↓
Eva Marie den 6 november 2010 kl. 18:03 skrev:

Intressant läsning. Det du beskriver i exemplen skulle jag kalla LRS (Least Reinforcing Stimulus) och beskriva T.O mer som Åsa beskriver det. Med skillnaden att när jag tränar t ex en tiger får jag gå därifrån om jag vill göra en T.O, eftersom jag inte kan sätta undan den.

Tycker vi definitivt skall prata mer om vad vi gör när det blir fel, just för att skapa en medveten handling kring det. Många djurtränare som får frågan ”vad gör du om det blir fel då?” kan inte riktigt svara på det…

På mina djur kan jag tänka mig att göra T.O vid ett enda tillfälle och det är vid aggression och då endast om de ser mig som något värdefullt att samarbeta med – så aggressionen inte är ett sätt att bli av med mig. Det hanterar jag på andra sätt.

Svara ↓
Pingback: Fel, fel… fel… eller rätt? « Team Propiraya
Fanny den 8 november 2010 kl. 16:54 skrev:

Eva Marie: Ja, det är inte lätt med definitioner. Ken Ramirez kallar LRS för en form av time out i sin bok ”Animal Training”. Men som jag har förstått LRS så ändrar man helt enkelt ingenting 3-5 sekunder. Målsättningen är att miljön ska vara oförändrad. Det tycker inte jag riktigt stämmer in på mina exempel, eftersom jag faktiskt gör någonting.

Svara ↓
Eva Marie den 8 november 2010 kl. 21:01 skrev:

Tack för förtydligandet. När du skrev tigger såg jag mig dig som passiv under den stunden.

Sedan kan det pratas om definitioner till döddagar, huvudsaken är att det pratas om VAD det finns för alternativ att göra när det blir fel. Och vad som leder framåt och vad som leder i cirkel.

Svara ↓
Cecilia den 9 november 2010 kl. 11:00 skrev:

Jag vet inte om jag fattat rätt, så jag måste få ett agilityrelaterat exempel: om Udo missar ingången i slalomet och jag inte låter honom fortsätta utan KALLAR TILLBAKA HONOM OCH LÅTER HONOM BÖRJA OM IGEN, är det en time-out? Det är ju iallafall varken ett straff eller en belöning…?

Svara ↓
Thomas den 9 november 2010 kl. 17:00 skrev:

Cecilia:
Du tar jo bort muligheten til å fortsette slalåmen (hvilket jeg antar er forsterkende), og gitt at han blir bedre av prosedyren, så kan vi kalle det negativ straff.
Men om du gjør om med en gang (uten noen pause der han ikke har mulighet til å oppnå belønning), så ville jeg ikke klassifisert det som en time-out.

Svara ↓
Thomas den 9 november 2010 kl. 17:06 skrev:

”At han blir bedre” var vel noe upresist, ”at atferden å misse inngangen blir mindre frekvent” er mer korrekt. 🙂

Svara ↓
Eva B den 10 november 2010 kl. 09:32 skrev:

Å vad bra att du skrev såna tydliga exempel Fanny! Håller helt med Eva-Marie om att det är precis såna här diskussioner träningsvärlden behöver 🙂 Alltså ”Hur ser det ut” det vi gör!

En undran från mig: Finns det någon tidsram i de här exemplen där hunden inte har möjlighet att tjäna belöning? Hur ser det ut då (vad gör du, vad gör hunden, hur länge, vad händer sen)? Försöker se flödet framför mig mer i detalj, och se vad det är som gör detta till TO och inte till ”bara en vanlig R-”.

Svara ↓
Morten Egtvedt den 10 november 2010 kl. 11:04 skrev:

Veldig bra skrevet. Liker spesielt godt koblingen din mellom følelser og forsterkning (og igjen hvordan det også har klar sammenheng med timeouter). Ingen tvil om at følelser er superviktige i hundetrening, selv om det er vanskelig å måle dem direkte. Men man skal jo ikke ha så mye erfaring for å kjenne igjen atferden til en glad hund 🙂

Svara ↓
Fanny den 10 november 2010 kl. 15:06 skrev:

Eva: Det är inte lätt det där med definitioner när man kommer in på praktiska exempel som de här.

I praktiken så brukar jag inte ha någon direkt tidsfördröjning när det gäller utgångsställningarna – det är bara gör-om-gör-rätt. När det gäller apporteringen och fotgåendet så kan det i början bli ganska långa pauser. Å andra sidan kan hunden påverka hur långa de blir, så det blir definitionsmässigt snårigt det med. När jag tar bort apportbocken eller avbryter fotgåendet så försöker jag få fram den känsla jag vill ha i hunden – aktivitet och vilja. När hunden är i rätt läge får den en ny chans. Med träning hittar hunden väldigt snabbt till rätt läge och den långa felritualen kan bantas ner till ett ord eller en liten gest.

Svara ↓