Výcvik bretaňských psů
Výcvik kanaánských psů
Výcvik psů čivavy
Výcvik staršího psa
 Keep Pet >> Domácí mazlíčci >  >> psi >> Výcvik

Pochopení výcviku psů založeného na odměně

Upravená dáma středního věku svižně kráčela po gumové podložce ve výcvikovém středisku a její černý labradorský retrívr spokojeně poskakoval po jejím boku. Hladce se zastavila a Skip se okamžitě posadil vedle ní v dokonalé poloze na patě. "Ano!" Pomyslel jsem si a pak sebou trhl, když Carla sáhla dolů a nadšeně poplácala Skipa po hlavě. Skip vyskočil a ustoupil od svého člověka.

"Carlo," řekl jsem tiše. "Právě jsi ho potrestal za to, že seděl rovně." Carlina tvář klesla. "Sakra!" vykřikla. "Proč si to nepamatuju!"

Pochopení výcviku psů založeného na odměně

Počkej chvíli . . . od kdy je poplácání psa považováno za trest? Od té doby, co nám Skip dal najevo, že sklonil hlavu a ustoupil z Carliny ruky, že se mu nelíbilo, když se nechal hladit. Všechny ostatní laboratoře, které Carla celý život vlastnila a trénovala, zbožňovaly, když se jich někdo dotýkal jako odměnu. Carla hladila svého psa za to, že je dobrý, aniž by na to myslela – byla to dobře podmíněná odpověď. Naneštěstí, protože Skip neměl rád, když se ho někdo dotkl, pokaždé, když mu to udělala, ve skutečnosti ho trestala a snižovala tak pravděpodobnost, že znovu předvede ten perfektní sed!

Rozhodnutí psa v životě a jeho výsledné chování jsou založeny na tom, zda konkrétní chování přináší něco, co se mu líbí (odměna), nebo něco, co se mu nelíbí (trest). Trénink je jednoduše záležitostí manipulace s odměnami a tresty promyšleným způsobem. . . Ale musíte svého psa znát – důkladně si uvědomovat, co má a nemá rád – a uvědomovat si své vlastní chování, aby vám „výcvik“ fungoval.

Odměny a tresty
V padesátých letech minulého století vyvinul behaviorální vědec B. F. Skinner řadu principů, které jsou použitelné pro všechny živé věci s centrálním nervovým systémem. Zjistil, že zvířata pravděpodobně budou opakovat chování, které je pro ně příjemné/odměňující, a nebude pravděpodobně opakovat chování, které vyústí v něco nepříjemného (trest). Neutrální podněty – věci, které jsou pro zvíře jedno – nemají na chování žádný vliv.

Skinner ukázal, že lidé mohou tyto jednoduché principy použít k úpravě chování zvířat. Odměny jsou nejspolehlivějším způsobem, jak záměrně zvýšit nabízené chování zvířete; naopak trest toto chování snižuje. (Viz „Čtyři principy operativního kondicionování“, další na konci příběhu). Tyto principy chování používáme při výcviku psů s velkým úspěchem.

Nicméně, stejně jako u Skip, praktické použití „odměn“ a „trestů“ se liší pes od psa, i když definice ne. Odměnou je vše, co má konkrétní pes rád. Trest je vše, co pes nemá rád.

Často používáme pamlsky jako odměnu při výcviku, protože téměř vždy najdeme nějaké jídlo, kterého si pes bude vážit natolik, že může sloužit jako neodolatelná odměna, ale jídlo není jedinou odměnou, kterou máme k dispozici. Pamatujte, že odměnou je vše, co má pes rád. Může to být poplácání po hlavě (ale ne pro psy jako Skip, kteří nemají rádi dotyky), slovní pochvaly, přetahovaná, honička za klackem nebo tenisovým míčkem, procházka na vodítku , jízda autem, povolení vyskočit na pohovku, narážka k běhu agility kurzu, osvobození od „čekání“ na vyběhnutí na dvůr, povolení skočit do jezera nebo signál k objetí stádo ovcí.

Když průměrný nezkušený psovod slyší slovo „trest“, obvykle si vybaví zjevné formy fyzického trestu, jako je plácnutí, štípání nebo kopání psa nebo škubání na vodítku. Nedoporučuji ani nepoužívám fyzické tresty, protože ohrožují psovoda, poškozují vztah s jeho psem a mohou zničit psí nadšení pro výcvik. Naštěstí fyzické tresty nejsou jediným způsobem, jak nežádoucí chování eliminovat.

Pamatujte, že behavioristé definují slovo „trest“ jako cokoli, co způsobí, že zvíře sníží určité chování. Takže v případě Skipa, laboratoře, který neměl rád, když se ho někdo dotýkal, stačilo poplácání po hlavě poté, co provedl rovné sedy, aby přestal tyto rovné sedy provádět.

„Pozitivní trenéři“ – lidé, kteří se zavázali cvičit bez použití bolesti, strachu, síly nebo zastrašování – často používají určité formy „trestání“ (ve smyslu chování) k dosažení svých tréninkových cílů. Například, když pes, který touží po fyzickém kontaktu a pozornosti, skáče po celém cvičáku, ona se k němu otočí zády a odstoupí, čímž odstraní jak svou pozornost (oční kontakt a interakce), tak možnost fyzického kontaktu se psem. To jsou odměny, které pes hledá tím, že vyskočí. Když skákací chování psa stále vede ke ztrátě něčeho, co moc chce, přestane skákat – zvláště když je tento „trest“ spojen s „odměnou“ pozornosti, pamlsků a mazlení za tiché sezení.

Co vlastně představuje trest nebo odměnu pro daného psa, je tedy individuální záležitostí; z hlediska chování je kontext vším.

Neúmyslný trénink
Výcvik je tedy záměrné používání odměn a trestů k účelové manipulaci s chováním psa. Co je někdy těžké si zapamatovat, je fakt, že psi se neustále učí, ať už dáváme pozor nebo ne. Lidé jsou často zmateni tím, proč jejich psi dělají některé věci, které dělají, nebo proč nedělají to, co po nich lidé chtějí.

Je to vlastně docela jednoduché. Psi dělají to, co pro ně funguje; nedělají věci, pokud z toho něco nemají.

Psi dělají věci, které považujeme za „nevhodné“, protože je to baví, je to dobrý pocit nebo to chutná. Z pohledu psa je chování, které je pro nás nepřijatelné, jako je vlézt do odpadu, honit kočky nebo spát na pohovce, prostě zábavné!

Frustrovaní majitelé často říkají svým trenérům:„Ví, že to nemá dělat! Když to udělá, trestám ho, ale on to pořád dělá. Proč?" Někdy požitek, který má pes z chování, převažuje nad "trestem" majitele. Psovi, který je velmi vzrušený zážitkem pronásledování kočky přes plot na dvorku, nemusí být ani trochu jedno, aby na něj za to křičeli.

V jiných případech může být „trest“ pro psa skutečně odměnou. Například bouřlivý labrador, na kterého křičí, bije nebo dokonce kopá za to, že vyskočil na svého majitele, nemusí mít ponětí, že křičení, bití a kopání má být trest. Pro psy, kteří touží po pozornosti a milují fyzický kontakt s lidmi, je toto hrubé zacházení jednoduše pozvánkou k příjemné (odměňující) hře.

Majitelé psů si také nemusí uvědomit, že často bezmyšlenkovitě trestají psa za to, že udělal správnou věc. Pokud to budete dělat dostatečně často, nechtěně svého psa „vycvičíte“, aby přestal nabízet chování, které chcete.

Vezměme si ženu, jejíž pes si užívá řádné dovádění s několika psími kamarády v psím parku. Je čas odejít, a tak k sobě zavolá svého psa. Okamžitě jí přenechá své herní kamarády a závody. "Hodný pes!" vykřikla, zapnula mu vodítko a odvedla ho z parku. Podle jejího názoru byla slovní pochvala dostatečná odměna a opuštění parku nijak nesouvisí s odvoláním. Ale pes to vidí takto:„Máma volala, přišel jsem a je konec. Když přijdu k mámě, stane se špatná věc – přestane být legrace.“ Pravděpodobně si dvakrát rozmyslí, zda přijde příště, až zavolá, zatímco si bude hrát s přáteli!

Mnoho lidí má spoustu problémů s výcvikem svého psa, aby na zavolání spolehlivě přišel. Možná dostatečně nezvážili, co se stane se psem většinu času poté, co přijde. Není třeba psovi Einsteinovi, aby si uvědomil, že přijít na zavolání je špatný nápad, pokud se mu neustále stane něco „špatného“ bezprostředně poté – řekněme, že se nacpe do sklepa nebo se zamkne před všemi hosty v kuchyni, nebo pohozené venku ve studeném dešti.

Trénink se také může pokazit, když odměna není dostatečně hodnotná, aby motivovala psa, aby se obtěžoval pokoušet se ji získat. Musíte naprogramovat automatickou odezvu na nápovědu „přijď“ s vysokou odměnou v nepřítomnosti lákavých rušivých vlivů, než se ji pokusíte použít tváří v tvář temperamentním veverkám. Málokterý pes odejde z honu na veverky, aby si přišel vydělat kus suché granule! Mnoho pozitivních trenérů používá různé lákavé odměny a míchá je. Pak si pes nikdy není jistý, jak velká bude „odplata“ za jeho dobré chování; prostě ví, že to bude dobré.

Pokud pochybujete o tom, že míchání malých odměn (jako je slovní pochvala, poplácání nebo kus suchého granule) s většími odměnami (jako jsou kousky čerstvého masa, honění míče nebo vypuštění na volno) je silnou motivací, zvážit výherní automat. Dokud bude vyplácet směsici žádných odměn, malých odměn a jen občasného jackpotu, lidští hazardní hráči tam budou dál sedět a tahat za kliku, dlouho po uplynutí doby, kdy to má smysl!

Náhodné akce posílení
Když budete mít v sadě tréninkového nářadí různé odměny, získáte větší flexibilitu a umožní vám trénovat vašeho psa, aniž byste vždy měli v kapse obrovskou zásobu pamlsků. Dobrý výcvikový program se posouvá směrem k variabilnímu posilování, jakmile pes spolehlivě provede nové chování. Místo toho, abyste klikali a dávali psovi pamlsek pokaždé, když provede chování, občas přeskočíte kliknutí a místo toho psa pochválíte, pak se znovu zeptáte na chování a kliknete na další. Postupně zvyšujte variace a délku plánu zesílení, nezapomeňte, že náhodnost je důležitá.

Pokud budete svého psa nutíte pracovat tvrději a tvrději jen na kliknutí, je pravděpodobné, že na vás skončí. Pokud změníte rozvrh posil, jako je automat v Las Vegas, nemůže předpovědět, kdy se vyplatíte. Dostanu tentokrát klik? Tentokrát? Tentokrát? Klikněte! Stejně jako lidé budou pokračovat v vkládání čtvrtí, váš pes bude nabízet chování s nadšením a je si jistý, že další vyhraje jackpot.

Chcete-li zachovat jeho nadšení, když postupně prodlužujete plán posilování, použijte další odměny, abyste mu dali vědět, že je stále na správné cestě. Často používám "Dobrý pes!" jako pochvalu poté, co kliknu a ošetřím, aby si moji psi spojili stejný hřejivý pocit, že dostali odměnu za jídlo, se slovní pochvalou. Když pak slovní pochvalu použiji i bez cvaknutí a pamlsku, mají stále stejnou klasicky podmíněnou odezvu z asociace pochvaly s jídlem a dělá jim to dobře. Takže:"Dobrý pes!" se stává užitečnou odměnou i bez jídla.

Jiné odměny mohou způsobit větší přerušení tréninkové hry. Pokud za odměnu použijete hračku, musíte se zastavit a nechat psa, aby si s ní chvíli hrál. To může fungovat opravdu dobře, aby ho posílilo na stupnici nadšení, zvláště pro psa, který je blázen do míčku nebo miluje přetahování. Nefunguje to dobře, když chcete dělat hodně opakování diskrétního chování za sebou. Pokud hodíte míčem pokaždé, když zareaguje na vaše tágo „dolů“, bude vám trvat dlouho, než uděláte půl tuctu opakování. Funguje dobře jako odměna za rozšířené chování, jako je pata. Pes, který šílí míčky, se může naučit patovat s dokonalou pozorností na dlouhé úseky v očekávání honby za míčem, která nastane na konci.

Načasování je klíčové
Pro úspěšný výcvikový program je důležité pochopit, co se vašemu psovi líbí a co ne, a tyto odměny a tresty efektivně využívat. Aby byly důsledky – dobré nebo špatné – účinné, musí být vyvozeny v těsné blízkosti chování, které se snažíte ovlivnit.

Řekněte svému psovi tipy nad vaší kuchyňskou popelnicí, když jste pryč v práci. Pokud ho napomenete, když se vrátíte domů z práce, několik hodin poté, co došlo k nájezdu na odpadky, naučíte tím svého psa, že jste někdy nepředvídatelní a nebezpeční, když přijdete domů. Bez ohledu na to, jak „provinile“ vypadá, když mu nadáváte, nedává žádnou spojitost mezi vaším chováním, kdy na něj křičíte, a jeho chováním, kdy se před hodinami dostal do odpadu. Vaše vnímání jeho zjevně provinilého svědomí, které se projevuje jeho skloněnou hlavou, nedostatečným očním kontaktem a plížením se podél základních desek, je chybnou interpretací jeho klasické psí řeči těla, které se snaží utišit váš hněv, ať už je příčina jakákoli.

Behavioristé se shodují, že odměna nebo trest musí být uděleny do tří sekund, nejlépe do jedné sekundy nebo méně, od chování, které se snažíte zvýšit nebo snížit. Toto je docela malé časové okno a podtrhuje hodnotu použití klikeru nebo jiné značky odměny (nebo značky bez odměny) k označení okamžiku požadovaného (nebo nevhodného) chování. Pokud řeknete "Jejda!" v okamžiku, kdy váš pes vyskočí a vy se odvrátíte, učíte svého psa značku bez odměny, kterou můžete svému psovi sdělit, jaké chování způsobilo, že dobrá věc zmizela (negativní trest). Pokud kliknete! nebo řekněte "Ano!" v okamžiku, kdy se váš pes posadí, pochopí, že sezení si vysloužilo odměnu, i když vám trvá několik sekund, než mu pamlsek vložíte do tlamy, a i když vstane ze sedu dříve, než mu stihnete pamlsek doručit. .

Přeskočení vpřed
S Carlou jsme dlouho diskutovali o tom, jak pokračovat ve Skipově tréninku. Identifikovali jsme dvě možnosti. Pomocí desenzibilizace jsme mohli Skipa naučit, že to, že ho Carla poplácá po hlavě, byla opravdu odměna, a to tak, že důsledně spojujeme její dotek s odměnou mimo mapu, nejprve jemným kontaktem, pak jeho intenzitou, dokud se nenaučí asociovat. energické poplácání „skutečně dobrými věcmi“. Carla se zavázala, že to bude dělat dlouhodobě, protože opravdu chtěla, aby si Skip užil její dotek.

Také jsme iniciovali krátkodobý přístup k úpravě Carlina chování a souhlasili s tím, že s ní použijeme pozitivní posilování a negativní tresty. Pokaždé, když se Skip posadil a ona se nenatáhla, aby ho poplácala, Carla získala odměnu, například čtvrtku, kousek čokolády nebo psí hračku. Pokaždé, když zapomněla a natáhla se, aby ho poplácala, beze slova jsem vyšel z tréninkové místnosti na dobu od 30 sekund do tří minut. Fungovalo to nádherně a ve chvíli, kdy se Carla zastavila, Skip šťastně seděl v perfektní poloze na patě, beze strachu z potrestání za jeho dobré chování.

-Od Pata Millera