Pokročilé způsoby odměňování

Aktualizováno 26.5.2017

Správně odměnit psa není zas tak snadné, jak se může na první pohled zdát. Nejdříve je třeba si uvědomit, co je pro psa odměna. Držme se vždy pravidla, že co je odměna, určuje jen a pouze Váš pes viz. článek Motivace psa. A určuje to ještě pes v konkrétní čas a v konkrétní situaci. V níže uvedeném textu jsou popsány techniky odměňování v pokročilém tréninku, kdy jsou psi trénováni operantním podmiňováním.

Pro pozitivní posílení používáme nejčastěji stabilní odměny:

  • potravu
  • předměty (balónek, rukáv, atd.)

Proč nepoužíváme slovní pochvalu a emoce

Slovní pochvalu a naše hřejivé emoce do tréninku dáváme, ale pouze jako složku variabilního odměňování. Slovní pochvala a emoce jsou velmi nestabilní složkou odměny. Pokud by o tuto odměnu pes skutečně stál, musel by ji vyžadovat stejně jako míček, kdy pes dělá cokoliv, aby míček získal. Tato energie, podobná jako u odměňování potravinovým pudem či loveckým pudem, u slovní pochvaly prostě není. Velmi často se používá u klasického výcviku, kde je celý výcvik založený na metodě cukru a biče. Cukr je slovní pochvala, emoce, piškot, míček a bič je fyzický nebo psychický nátlak (což už je i zvýšení hlasu - dominantní agrese). U tohoto způsobu pes dané chování musí vykonat a celé je to postaveno na konceptu, že pes se snaží tzv. vyhovět psovodovi a vyhnout se konfliktu, tedy motivací je obranné chování viz. článek Motivace psa.

Další důvodem je, že každé slovo v tréninku je navíc. Především ve fázi vysvětlování, kdy situaci stavíme stereotypně a co nejsnáze, aby ji pes, co nejrychleji pochopil. Představme si to nepřeberné množství informací, které musí pes vyselektovat, pokud mu do toho začneme motat tisíce slov a emocí. Krom toho pes naší řeči (češtině) opravdu nerozumí.

Velmi důležitým důvodem je také to, že nechceme, aby se naše emoce staly součástí cviku. Nedokážeme kontrolovat své emoce, nedokážeme je simulovat, aby byly vždy stejné. A jeden příklad za všechny - zkoušky a závody. Kolik lidí vyhořelo jen kvůli emocím. Pokud se stanou součástí cviku a vy jste najednou nervózní, je to pro psa úplně nová situace, je to jakoby cvičil úplně od začátku a to se samozřejmě projeví na jeho výkonu.

"Emoce má především zažívat sám pes během výkonu a ne psovod po výkonu psa"

Jak poznat, že jsem odměnil správně?

Trénink není nic jiného než otázka poptávky a nabídky. To znamená, že psovi musíte za jeho práci (chování či cvik) řádně zaplatit. Výše odměny tedy musí být vyšší než námaha, kterou pes musel vynaložit. To, jestli jsme zaplatili dostatečně nám opět řekne pes:

  • odměna je dostatečná = pes se ihned vrátí zpět do chování či vyžaduje svojí aktivitou další možnost k vykonání cviku
  • odměna není dostatečná = pes se k Vám již nevrátí a nejčastěji odbíhá za vlastní zábavou

Příklad: Po povelu "ke mně" pes přibíhá a Vy ho odměníte. Pokud odměníte cvik přivolání v očích psa dostatečně, pes zůstane u Vás a bude se dožadovat další odměny. Pokud neodměníte cvik přivolání v očích psa dostatečně, pes ihned odbíhá od Vás a právě jste psa zároveň naučili, že námaha za splnění cviku "ke mně" se mu nevyplácí = cvik je oslaben!

Pokročilé způsoby odměňování

Pravidelné a variabilní odměňování

Jedna z největších chyb v klikrtréninku  a vůbec v odměňování je, že odměna je pořád stejná a předvídatelná. Nejčastěji se jedná o jeden kousek pamlsku. Tedy například v klikrtréninku - klik = 1 piškot. Taková nuda! Kvůli tomuto konceptu se nám často rozpadá celý výcvik, pes se velmi rychle naučil, že odměna má vždy obnos jednoho piškotu. Co ale když po něm chci práci v hodnotě 5 piškotů? Ve fázi vysvětlování je dobré používat pravidelné a velké odměny a pokud pes již chování rozumí, přejít na variabilní odměňování. Tedy jednou to jsou 2 piškoty, jindy 5, 1, 7, míček, nic, sekundární posilovač, jackpot atd. Variabilní odměňování totiž vzbuzuje v psovi očekávání (viz. foto), které ve Vašem psovi probudí velkou dávku energie.

Očekávání
Očekávání

Pravidelné odměňování

  • tvaruje líného psa
  • nevzbuzuje očekávání

Variabilní odměňování

  • zvyšuje rychlost a aktivitu psa
  • vzbuzuje očekávání
  • uvolňuje hormon štěstí - dopamin

Jackpot - Dopamine - Prof. Sapolsky

Profesor biologie na Stanfordské univerzitě  Robert Sapolsky studoval u opic jejich úroveň dopaminu (hormon štěstí). Každá opice měla naučené chování: rozsvítí se světlo, 10x zmáčknou tlačítko a obdrží banány. Většina si myslí, že největšího potěšení opice dosáhnou až poté, co obdrží banány. Je to naopak, největšího potěšení dosáhnou po rozsvícení světla. O této reakci jsme se již zmínili v článku Jak na klikr, kdy se samotný klik stane větší odměnou než  fyzická odměna.

S návazností na variabilní odměňování je však daleko zajímavější fakt, že pokud opice dostaly odměnu jen v každém druhém chování, jejich hladina dopaminu naopak vzrostla. Tedy o 50% méně odměn, ale dvojnásobná hladina hormonu štěstí dopaminu.

Když se samotné chování (cvik) stane odměnou

Když se samotné chování (cvik) stane odměnou je to ta největší meta, které při výcviku můžeme dosáhnout. K tomuto cíli všichni směřujeme. Stát se to může v několika případech:

  1. Stejně jako klik se stane pro psa důležitější než samotná fyzická odměna, může se tak stát i samotné chování. Opakováním může dojít k posunu: fyzická odměna -> klik (sekundární posilovač) -> chování (stane se samo o sobě sekundárním posilovačem)
  2. U cviků, které uvolňují adrenalin (např. skoky - typické pro agility). Adrenalin je návyková látka, na které se pes může stát snadno závislý a uvolňuje ho právě při daném chování, kde ho samotné chování odměňuje. Ze světa lidí typické pro lidi cvičíčí fitness, kdy fyzická námaha uvolňuje hormon štěstí a lidé se pak stávají závislí na cvičení.
  3. Očekávání. Díky zapojení prvku očekávání, kdy se uvolňuje hormon štěstí dopamin. Na dopaminu se pes také stává závislým a odměňuje ho poté samotné chování. Očekávání lze použít na jakékoliv chování. Ze světa lidí typické pro lidi hrající hazardní hry, kdy už nejde o výhru, ale o závislost na samotném hraní.

Když pes dané chování (cvik) koná rád sám o sobě a my ho nemusíme ani odměňovat, je to super věc, ale zároveň jsme také přišli o kontrolu nad naším psem, protože nyní už se odměňuje sám a my nemáme nástroje, jak dané chování měnit (pokud je to třeba). Klesá nám soustředěnost. Jen si vzpomeňme na agility a ty uštěkané a nedočkavé psy, kteří již chtějí na parkur. Proto je tak důležitý balanc, jakmile toto chování začnu pozorovat, ihned se na něj zaměřím, abych nepřišel o nástroje, jak mít dané chování pod kontrolou.

Váš tým Psí školy Arka "I pes k nám mluví... Naučme se mu rozumět."  

V článku jsou použité informace z Jiří Ščučka - Animal Training Academy s.r.o. a jsou směřovány k výcviku psů. Nepoužívejte variabilní odměňování a nevzbuzujte očekávání u jiných druhů zvířat.