Det är många som vill träna sin tävlingshund med positiv förstärkning, utan fysiska eller verbala korrigeringar. Men är det korrekt att säga att du bara använder förstärkning och inte straff? Även om du baserar din träning uteslutande på belöning, kommer du inte komma ifrån att du ibland inte belönar beteenden som tidigare har blivit förstärkta (extinktion) eller att du tar bort möjligheten till belöning (negativt straff).
I den här artikeln ska jag ta upp vad vi kan göra när hunden gör fel på träning och vad man behöver tänka på när man använder sig av negativt straff.
Vad gör du när det blir fel?
När hunden gör något annat än det vi hade tänkt oss i träningen kan man välja olika strategier. Man kan välja att göra det enklare för hunden så fort det blir fel. Andra väljer att avbryta och göra om på samma svårighetsnivå. Ytterligare ett alternativ är att låta hunden fortsätta och belöna när det tillslut blir rätt.
Vilken strategi som fungerar bäst beror på många olika faktorer. Hundar är olika och hanterar frustration och besvikelse på olika sätt. De främsta skillnaderna ligger ofta i hur väl hunden kan uppgiften, hur gärna hunden vill ha belöningen och hur förstärkande det är att göra fel.
Att låta hunden fortsätta efter ett fel och belöna när det blir rätt igen, kan vara en bra strategi under inlärning. Hunden vet varken vad som är rätt eller fel och måste få en chans att lära sig genom att prova olika tekniker. Problemet med den här taktiken är att vi riskerar att förstärka allt som händer innan belöningen (även det som var fel). Om man väljer att ignorera felen och belöna när det blir rätt, är det väldigt viktigt att man belönar varje gång det blir rätt. På så sätt får hunden maximalt med information om vad vi vill och också information om när det inte är rätt (det kom ju ingen belöning). Ju mer man delar upp momentet i små delar, desto färre fel riskerar man att belöna.
När hunden har blivit säker på uppgiften och vi börjar sträcka tiden eller lägga in fler delar i momentet, blir det genast mindre svart-vitt för hunden om vi väljer att ignorera felen. Eftersom han ibland får fortsätta när det är rätt, och ibland får fortsätta när det blir fel, blir informationen mindre tydlig. Här rekommenderar vi i alla fall att du väljer en annan strategi.
Vad gör du när det blir fel?
En precis definition av negativt straff är att en positiv förstärkare tas bort och beteendet blir mindre sannolikt. Andra namn är typ 2-straff eller "response cost". Exempel kan vara att ett barn får indragen veckopeng eller en spelare som blir utvisad för oschyst spel i ishockey. I dagligt tal pratar man ibland om "time out", ett uttryck som ger rum för fantasifulla tolkningar. En "time out" är en form av negativt straff, där möjligheten till förstärkning tas bort. Det kan innebära att du tar en liten paus i träningen där ingenting händer när hunden tjuvstartar på agilitybanan eller att du sätter in hunden i bilen igen under en kort stund när hunden försöker springa fram till en annan hund.
När kan du använda negativt straff?
Av Susan Garrett lärde vi oss att vara väldigt försiktiga med användandet av negativt straff. Hon uppmuntrar oss att ställa två viktiga frågor. Den första är: Vad tjänar hunden på att göra rätt? Eller som Bob Bailey säger: "Make it worthwhile for the animal to play our silly little games". Utveckling av bra belöningar och en grundlig inlärning där hunden inte bara blir helt säker på vad han ska göra, men också verkligen älskar att utföra momenten, är någonting som vi aldrig kommer ifrån. Straff kan aldrig lära hunden nya beteenden och aldrig få hunden att älska sitt jobb. Man kan inte kompensera för dåliga tränarfärdigheter genom att straffa hunden när den gör fel. För att negativt straff över huvud taget ska fungera, måste hunden först ha fått många belöningar för rätt beteende. Du måste använda dig av positiv förstärkning för att du ska ha någonting betydelsefullt att ta bort. Ett typiskt exempel där man glömmer bort det här, är inlärning av apportering. Ägaren tar fram apporten, hunden visar inget intresse för apporten och ägaren tar apporten bakom ryggen. Om du vill ta bort möjligheten till belöning, måste du se till att det du tar bort faktiskt har betydelse för hunden.
Först nu kan du ställa dig den andra frågan: Vad kostar det att göra fel? Enkla beteenden som inte kostar någon större energi för hunden att utföra, kan vara väldigt svåra att bli av med enbart med hjälp av extinktion. Vi är knappast de enda som drar i butiksdörren trots att det står "tryck" med stora bokstäver. Vi kan läsa och vi vill gärna komma in i butiken, men det kostar så lite att prova en gång och sedan göra rätt på andra försöket, att vi aldrig tar oss tid till att läsa. Om dörren däremot hade gått i baklås varje gång vi gjorde fel och vi var tvungna att gå runt byggnaden och gå in bakvägen, hade vi nog inte gjort det misstaget flera gånger.
Hundar fungerar på samma sätt. Varför lyssna på om föraren säger "stå", "sitt" eller "ligg", när man får en ny chans direkt efteråt? Varför är det så viktigt att titta upp hela tiden under fria följet, när man ändå kan fortsätta och få sin belöning till slut? När beteendet hunden ska utföra inte bara är enkelt, utan också ganska kul, blir effekten naturligtvis ännu större. Våra agilityhundar bryr sig inte nämnvärt om ifall de behöver ta om slalomen tio gånger innan det kommer belöning, det är ju så kul att springa. Ibland är det inte så dumt att låta fel respons kosta lite, det gör hunden mer efertänksam och gör att han tar vara på de chanser han får med större noggrannhet.
Om det handlar om ett enkelt beteende, är det enklast att bara ta en kort paus. Du kan be hunden lägga sig ner en stund eller sätta dig ner och hålla hunden i halsbandet. Det finns absolut ingen anledning till att bli kort eller otrevlig mot hunden. Du får gärna säga "oj, så tokigt det blev" och klappa om hunden under pausen. Vi räknar med att våra hundar ändå hellre hade velat få göra om uppgiften och få sin belöning. Om du inte tror att din hund fungerar så, bör du nog gå tillbaka och fundera över hur bra dina belöningar egentligen är. Om det handlar om en längre kedja eller en lång sträcka med fritt följ, fungerar det ofta bra att bryta hunden på ett positivt sätt och gå tillbaka till utgångspunkten och låta hunden göra om hela kedjan på nytt. Här gör uppgiftens längd ofta att det blir tillräckligt jobbigt att göra fel. Fall dock inte i fällan att belöna mycket tidigare när du gör om andra gången. Då kommer det inte att kosta något för hunden att göra fel.
Vad vill du uppnå?
Vi måste hela tiden utvärdera effekten av det vi gör i träningen. Förlorar du farten och glädjen? Blir hunden mer koncentrerad och försöker hårdare? Eller har det ingen effekt över huvud taget? Fundera över följande frågor. Har du belönat rätt beteende tillräckligt många gånger och tillräckligt bra? Har hunden verkligen förstått vad som förväntas av honom? Har du gått för snabbt fram i grundträningen och omedvetet belönat hunden för oangagerade eller varierande utföranden? Kom ihåg att du inte bara tränar själva beteendet, utan också får en viss arousalnivå och vissa känslor med på köpet. Därför kan det vara en god idé att avbryta felbeteenden på olika sätt, beroende på vad du vill ha i momentet och hur felet ser ut. I ett sammanhang kanske det fungerar kanonbra att binda upp hunden och leka själv med leksaken. I ett annat sammanhang kanske det är smartare att sätta sig ner och ta det lugnt i en halvminut.
Var uppmärksam på tecken på frustration eller besvikelse. Vi vill ha hundar som ser glada och energiska ut, inte oroade eller frustrerade. En hund som visar frustration eller besvikelse i lydnadsringen är inte trevlig att titta på och får sällan lika höga poäng som en riktigt självsäker hund. Vi tror att det är smart att lära hunden att hantera frustration redan från valpstadiet. Ofta vill vi så gärna hjälpa valpen så fort den blir det minsta ouppmärksam, frustrerad eller ser ut att ge upp. Det blir lätt en ond cirkel där hunden lär sig att skall, pip, ointresse eller en stressad uppsyn lönar sig mer än hårt tankearbete. Hundar som lär sig att hantera frustrationen tidigt, kommer ha lättare att klara av de krav vi ställer längre fram utan oönskade bieffekter.
Genom att "ladda" alla situationer som du använder som time out med belöningar, minskar du risken för ovälkomna biverkningar. Kom ihåg att målsättningen är att hunden ska få en paus ifrån chansen att tjäna fler belöningar - inte att hunden ska börja dra sig undan eller känna obehag. Vi tar ibland hundarna i halsbandet för att signalera paus. För att undvika bieffekter tar vi ofta hundarna i halsbandet i andra situationer och belönar hunden direkt. Det blir en kul lek som vi gärna använder som uppvärmning. Vi tar tag i hundens halsband och sätter igång en kul kamplek. Mer allvarliga fel, som att hunden försöker springa iväg under träning, kan ibland straffas med att hunden får gå tillbaka in i bilen en stund. Självklart är det inte bilen i sig som är straffet, utan det att hunden inte får vara med och träna längre på en stund. Vi är noga med att hunden tycker att bilen är en trevlig plats att vara på (men naturligtvis blir den aldrig lika spännande som träningen) genom att belöna hunden för att han hoppar in och stannar i bilen på egen hand ofta.
Man kan mycket väl använda beteenden som hunden tycker om när det blir fel, så länge det man tar bort är mer värt. Vi belönar ofta hundarna på olika sätt när de går fint i kopplet, trots det fungerar det att sätta på hunden kopplet och låta den gå kopplad en bit när hunden valde att inte komma på inkallning i skogen. Att få springa lös i skogen är trots allt roligare än att gå i koppel.
När korrigeringar blir betingade förstärkare
När man studerar hundägare som passerar förbi utanför huset regelbundet, ser man många som har problem med att hunden drar i kopplet, år ut och år in. Scenariet ser ut ungefär så här: Hunden drar i kopplet. Ägaren säger "nej", rycker hunden tillbaka några decimeter, säger "braaa!" och fortsätter framåt. I början handler det ofta om lätta ryck, men styrkan ökar gradvis. Så passerar de utanför vårt hus, dag efter dag, år efter år. Varför blir det inte bättre? Förstår inte hunden att han slipper rycket om han bara går fint?
Alla som har besökt en agilitytävling har säkert sätt det här fenomenet när förarna ska lämna sina hundar i starten: Föraren sätter hunden i starten och går förbi första hindret. Hunden reser sig och smyger framåt. Föraren vänder sig om och säger strängt "Nej!", "Sitt". Hunden hukar sig och sätter sig ner. Samma sak upprepar sig flera gånger. Efter tredje eller fjärde "Nej!", "Sitt", sitter hunden stilla i någon sekund och föraren startar hunden. Om man pratar med ägaren om startproblemet, säger de ofta "Men hunden lyssnar ju på mitt nej, då måste det ju vara okej att låta honom starta?!"
De här båda scenerna är exempel på hur korrigeringar kan komma att verka som positiva förstärkare. Korrigeringsbaserad träning blir ofta väldigt tillåtande. Hunden vänjer sig gradvis till mer och mer obehag, eftersom han får det han allra helst vill ha (komma framåt, starta) direkt efteråt. Det har forskats på den här typen av betingning och man har fått råttor att arbeta för elchocker (till slut helt utan mat eller andra "belöningar"). I praktiken blir inte "nej" eller ryck i kopplet straff, utan tillvänjning till obehag och ett löfte om belöning. Även korrigeringsbaserade tränare bör tänka på att inte omedvetet förstärka felaktiga beteenden genom att låta hunden få nya försök på en gång.
Din träning, ditt ansvar
Hundar gör inte saker för att jävlas, göra oss arga eller provocera. De gör det som lönar sig för stunden. Det är vår uppgift som tränare att se till att rätt beteende lönar sig och att fel beteende inte lönar sig. Även om det finns beteenden som vi inte tycker om, så tycker vi alltid om vår hund. Vi gillar hundar för att de gör det som lönar sig, för att de inte har några dolda agendor eller är långsinta. När du jobbar med belöningsbaserad träning känner vi att det ibland är nödvändigt att straffa fel beteende genom att ta bort (möjligheten till) belöningar. Men det är just beteendet vi vill straffa, aldrig hunden. Om man vill ha en hund som tycker att träningen är rolig, som inte känner oro eller osäkerhet, tror vi att det är viktigt att komma ihåg. Det finns ingen anledning att bli sur eller irriterad. Låt belöningarna tala sitt tydliga språk.
Ditt ansvar är också att se till att hunden behåller en positiv attityd och självförtroende i träningen. För varje time out bör hunden få minst 10 belöningar och om du märker att du inte får någon effekt av det du gör, måste du stanna upp och lägga en ny plan.
Praktiska exempel
De två frågorna (Vad tjänar hunden på att göra rätt? Vad kostar det att göra fel?) bör alltid finnas i bakhuvudet, men det kan krävas lite fantasi för att införa det i egen träning. Vi rekommenderar också att du varierar hur du tar en time out eller använder negativt straff. Ibland kan man också utnyttja belöningar eller aktiviteter av olika kvalitet för att visa hunden på skillnaden. Här kommer några exempel på temat "Vad kostar det att göra fel?".
- Jaktspanieln älskar att gå på nya platser och känna nya dofter, men matte vill gärna att hon ska gå fint vid sidan. När Shejpa lämnar positionen vid sidan, vänder de och går åt andra hållet. Shejpa får alltså gå över samma mark tre gånger innan hon kommer vidare igen och det är så tråkigt i jämförelse med att få känna nya dofter, att det är väldigt effektivt och inte kräver många repetitioner. På en annan hund hade det kanske inte haft någon effekt alls. Det gäller att känna sin hund och veta vad som är värdefullt.
- Lydnadshunden börjar sakta in i förväntan på ställandet under inkallning. Matte försöker avbryta och göra om, men effekten blir att hunden slutar att komma på inkallningen (det var ju uppenbarligen fel att komma). Nästa gång struntar matte i att hunden saktar in, istället låter hon hunden komma hela vägen in till sidan och få en torr godbit innan de gör om momentet. En torr godbit var inte riktigt vad Twiggy hade förväntat sig - hon brukar ju få kamplek efter inkallning! När de nu gör om, har hunden kvar självförtroendet, men vill gärna komma åt den där leksaken och kommer i full fart.
- En liten pudel på agilitykurs springer ifrån matte då och då för att hälsa på andra hundar. När folk försöker fånga in den olydiga pudeln är hon överlycklig. Inte nog med att hon får hälsa på de andra hundarna, hon får leka jage med människorna också! Nästa gång hunden sticker iväg, lämnar alla kursdeltagare och hundar den inhägnade planen och matte går iväg bakom huset. Efter en kort stund kommer hunden på att det här inte alls var så kul och börjar spana efter sin matte. Strax därefter kommer matte in via en annan ingång till planen och när hunden upptäcker henne bjuder hon upp till en enkel uppgift och leker sedan. Efter tre repetitioner var hunden noga med att hålla sig till sin matte, trots att de andra hundarna lekte nära dem.
- Sökhunden bestämmer sig för att ta hela sökrutan på egen hand och vill inte komma på inkallning. Matte blir arg och springer ut för att hämta hunden. När hon gör om upprepar sig samma sak. Till slut blir hon så uppgiven att hon tar hunden i koppel och sätter tillbaka honom i bilen. När han kommer ut igen efter de andra hundarna, uppför han sig som en ängel, gör perfekta slag och hittar sin figurant. Han är den typen av hund som prioriterar att få jobba framför lite obehag.
- Under ett agilitypass har föraren bestämt sig med att jobba på två olika övningar. Dels att ligga uppbunden och vara lugn, dels att sitta stilla i starten och få göra korta kombinationer när startbeteendet är bra. Trots att föraren belönar hunden ofta när hon är uppbunden, är det ingen tvivel om att hunden tycker att det är häftigare att träna starter. När hunden väljer att tjuvstarta, tar föraren med sig hunden till kopplet och startar med uppbindningsträningen istället. Hunden får fortfarande belöningar, men hade nog önskat att hon satt stilla, så att hon fick fortsätta köra agility. Efter ett par tjuvstarter med samma konsekvens går det inte att rubba hunden i starten utan frisignal.
Sammanfattning
- I praktiken är en time out en kort paus från en aktivitet som hunden tycker om.
- Fundera först över vad hunden tjänar på att göra rätt. Om hunden inte uppskattar belöningen eller upplever träningen som belönande, kommer inte negativt straff eller time outer att ha någon effekt.
- Var självkritisk och fundera först över om du har varit tydlig nog mot hunden och lärt honom vad han ska göra.
- Ladda upp time out-situationerna med belöningar. Gör det till en lek där du kan ta hunden i halsbandet, skicka in honom i bilen, be honom lägga sig ner - och belöna det rikligt.
- Utvärdera hela tiden hundens attityd och träningsvilja. Börjar hunden gå ner sig, bör du snabbt ändra din plan och se över din träning.
- Kom ihåg att du straffar beteenden, inte hunden.
- Håll reda på statistiken. Minst 10 belöningar för rätt beteende för varje gång du tar en time out.
- Ha kul när du tränar din hund och se till att hunden har minst lika roligt!