Vězňovo dilema

Vězňovo dilema označuje v teorii her typ hry s nenulovým součtem, ve které mají dva hráči („vězni“) možnost spolupracovat nebo nespolupracovat spolu (tedy mluvit s "vyšetřovateli") a výsledný stav výplaty („doba, ke které budou odsouzeni“) závisí na rozhodnutí každého z nich (nemohou vzájemně komunikovat). Tak jako u mnoha jiných her se předpokládá, že každý hráč se stará především o svůj prospěch – snaží se maximalizovat své výhody a nebere ohled na prospěch ostatních hráčů.

Dominantní strategií (tzv. strictly dominating – „přísně dominující“) je zde nespolupráce, tj. bez ohledu na to, jakou strategii si vybere spoluhráč, vykazuje nespolupráce pro hráče vždy lepší výsledek než spolupráce. Racionální hráč se rozhodne pro „zradu“. Takže pro hru je jediná možná rovnováha, a to když oba hráči nespolupracují. Tato rovnováha však překvapivě nemusí vést k Paretovsky optimálnímu řešení. To znamená, že pokud by oba hráči zůstali loajální, v konečném součtu by oba dva získali více, než když nespolupracují.

Jiná situace nastane, pokud jde o tzv. iterované (opakované) vězňovo dilema, hra se hraje opakovaně. Hráč tu má možnost „potrestat“ druhého za předchozí nekooperativní hru. Zde se racionální strategií může stát spolupráce.[1][2] Čím více se počet opakování blíží k nekonečnu, tím více Nashova rovnováha směřuje k Paretovu optimu.

Klasické vězňovo dilema

Policie zadržela dva podezřelé – Adama a Boba – a drží je odděleně. Důkazy, které má policie, nejsou dostatečné pro usvědčení, takže se musí spoléhat na přiznání obviněných.

  • Oba budou svědčit proti sobě. Délka trestu bude 6 let.
  • První udá druhého a druhý nebude vypovídat. Udavač bude osvobozen a druhý odsouzen na plných 10 let.
  • Pokud oba odmítnou vypovídat, budou odsouzeni oba za drobnější přestupky jen na 2 roky.

Vzhledem k tomu, že ani jeden zadržený si nemůže být jistý, co zvolí ten druhý, nastává dilema: mluvit, nebo mlčet?

Bob mlčí. Bob mluví.
Adam mlčí. Oba odsoudí pouze na 2 roky. Adam dostane 10 let, Bob bude volný.
Adam mluví. Adam bude volný, Bob dostane 10 let. Oba odsoudí na 6 let.

Adam uvažuje takto:

  • Pokud bude Bob mlčet a já také, dostanu trest na 2 roky, takže lepší bude mluvit, protože budu dříve volný.
  • Pokud bude Bob mluvit a já mlčet, dostanu 10 let, takže lepší bude vypovídat, protože dostanu jen 6 let jako on za to, že vypovídal rovněž.

Stejně uvažuje i Bob, takže pokud oba udělají víceméně racionální rozhodnutí, tj. budou oba dva vypovídat, dostanou oba trest v délce 6 let, přestože překvapivě optimálním rozhodnutím je vůbec nevypovídat, přičemž v tom případě by oba dostali trest v délce jen 2 roky.

Iterované (opakované) vězňovo dilema

Iterované (opakované) vězňovo dilema znamená, že dva hráči hrají vězňovo dilema vícekrát za sebou, přičemž si pamatují předchozí rozhodnutí soupeře a mohou podle nich měnit svou strategii.

Pokud hráči vědí, že hra bude mít určitý počet opakování, pak je pro ně dominantní strategií a Nashovou rovnováhou mluvit v každém kole. To lze dokázat indukcí: hráči by teoreticky mohli počkat a promluvit až v posledním kole, protože vědí, že po něm už soupeř nebude mít možnost odvety. Proto v posledním kole promluví oba. V tom případě hráči ale vědí, že by dost dobře mohli promluvit už v předposledním kole. Proto oba promluví už v něm. A tak lze pokračovat. Totéž nastane, pokud je délka hry neznámá, ale hráči vědí, že hra někdy skončí.

Lidské chování ve vězňově dilematu

Experiment na základě tohoto jednoduchého dilematu prokázal, že přibližně 40 % účastníků hrálo kooperativně (tzn. odmítli vypovídat).[zdroj?]

Odkazy

Reference

  1. VRÁNA, Jakub. Vězňovo dilema. PHP triky [online]. 2013-02-08 [cit. 2023-07-01]. Dostupné online. 
  2. HOUSER, Pavel. Teorie her v praxi (2): vězňovo dilema na 100 kol [online]. 2008-01-04 [cit. 2023-07-01]. Dostupné online. 

Externí odkazy