Vězňovo dilema označuje v teorii her typ hry s nenulovým součtem, ve které mají dva hráči („vězni“) možnost spolupracovat nebo nespolupracovat spolu (tedy mluvit s "vyšetřovateli") a výsledný stav výplaty („doba, ke které budou odsouzeni“) závisí na rozhodnutí každého z nich (nemohou vzájemně komunikovat). Tak jako u mnoha jiných her se předpokládá, že každý hráč se stará především o svůj prospěch – snaží se maximalizovat své výhody a nebere ohled na prospěch ostatních hráčů.
Dominantní strategií (tzv. strictly dominating – „přísně dominující“) je zde nespolupráce, tj. bez ohledu na to, jakou strategii si vybere spoluhráč, vykazuje nespolupráce pro hráče vždy lepší výsledek než spolupráce. Racionální hráč se rozhodne pro „zradu“. Takže pro hru je jediná možná rovnováha, a to když oba hráči nespolupracují. Tato rovnováha však překvapivě nemusí vést k Paretovsky optimálnímu řešení. To znamená, že pokud by oba hráči zůstali loajální, v konečném součtu by oba dva získali více, než když nespolupracují.
Jiná situace nastane, pokud jde o tzv. iterované (opakované) vězňovo dilema, hra se hraje opakovaně. Hráč tu má možnost „potrestat“ druhého za předchozí nekooperativní hru. Zde se racionální strategií může stát spolupráce.[1][2] Čím více se počet opakování blíží k nekonečnu, tím více Nashova rovnováha směřuje k Paretovu optimu.
Albert W. Tucker hru později pojmenoval „vězňovo dilema“ a výsledky v ní popsal formou délky trestů odnětí svobody. Vězňovo dilema je modelem mnoha reálných situací, které zahrnují strategické chování. Označení „vězňovo dilema“ se běžně používá k popisu situací, v nichž dvě entity mohou spoluprací získat výrazné výhody, nebo utrpět tím, že spolupracovat nebudou, přičemž koordinace jejich rozhodnutí je obtížná nebo nákladná.
Klasické vězňovo dilema
Policie zadržela dva podezřelé – Adama a Boba – a drží je odděleně. Důkazy, které má policie, nejsou dostatečné pro usvědčení, takže se musí spoléhat na přiznání obviněných.
- Oba budou svědčit proti sobě. Délka trestu bude 6 let.
- První udá druhého a druhý nebude vypovídat. Udavač bude osvobozen a druhý odsouzen na plných 10 let.
- Pokud oba odmítnou vypovídat, budou odsouzeni oba za drobnější přestupky jen na 2 roky.
Vzhledem k tomu, že ani jeden zadržený si nemůže být jistý, co zvolí ten druhý, nastává dilema: mluvit, nebo mlčet?
|
Bob mlčí.
|
Bob mluví.
|
Adam mlčí.
|
Oba odsoudí pouze na 2 roky.
|
Adam dostane 10 let, Bob bude volný.
|
Adam mluví.
|
Adam bude volný, Bob dostane 10 let.
|
Oba odsoudí na 6 let.
|
Adam uvažuje takto:
- Pokud bude Bob mlčet a já také, dostanu trest na 2 roky, takže lepší bude mluvit, protože budu dříve volný.
- Pokud bude Bob mluvit a já mlčet, dostanu 10 let, takže lepší bude vypovídat, protože dostanu jen 6 let jako on za to, že vypovídal rovněž.
Stejně uvažuje i Bob, takže pokud oba udělají víceméně racionální rozhodnutí, tj. budou oba dva vypovídat, dostanou oba trest v délce 6 let, přestože překvapivě optimálním rozhodnutím je vůbec nevypovídat, přičemž v tom případě by oba dostali trest v délce jen 2 roky.
Vypovídat je v tomto případě vždy výhodnější než mlčet, proto se pro oba hráče jedná o striktně dominantní strategii. Rozhodnutí obou hráčů vypovídat je v této hře jedinou silnou Nashovou rovnováhou. Protože kolektivně ideální výsledek vzájemné spolupráce je z hlediska vlastního zájmu iracionální, není rozhodnutí obou hráčů mlčet Nashovou rovnováhou, která by byla Pareto efektivní.
Iterované (opakované) vězňovo dilema
Iterované (opakované) vězňovo dilema znamená, že dva hráči hrají vězňovo dilema vícekrát za sebou, přičemž si pamatují předchozí rozhodnutí soupeře a mohou podle nich měnit svou strategii.
Iterované vězňovo dilema je základem některých teorií lidské spolupráce a důvěry. Za předpokladu, že je tato hra věrohodným modelem transakcí mezi dvěma lidmi, které vyžadují důvěru, lze kooperativní chování v populaci modelovat pomocí iterované verze s více hráči. Grofman a Pool odhadli v roce 1975 počet odborných článků o této hře na více než 2 000. Iterované vězňovo dilema se také nazývá "hra o válce a míru".[3][4]
Obecná strategie
Pokud hráči vědí, že hra bude mít určitý počet opakování, je pro ně dominantní strategií a Nashovou rovnováhou mluvit v každém kole. To lze dokázat indukcí: hráči by teoreticky mohli počkat a promluvit až v posledním kole, protože vědí, že po něm už soupeř nebude mít možnost odvety. Proto v posledním kole promluví oba. V tom případě hráči ale vědí, že by dost dobře mohli promluvit už v předposledním kole. Proto oba promluví už v něm. A tak lze pokračovat. Totéž nastane, pokud je délka hry neznámá, ale hráči vědí, že hra někdy skončí.
Aby mezi racionálně uvažujícími hráči nastala spolupráce, musí být počet kol neznámý nebo nekonečný. V takovém případě už strategie "vždy promluvit" nemusí být dominantní strategií. Jak ve svém článku[5] z roku 1959 poukázal Robert Aumann, racionálně uvažující hráči, kteří se střetávají v nekonečně dlouhých hrách, mohou začít spolupracovat. Hráč může být kupříkladu méně ochoten spolupracovat, pokud jeho protějšek už mnohokrát nespolupracoval, což vede ke zklamání. Naopak s postupem času se pravděpodobnost spolupráce zpravidla zvyšuje díky vzniku tzv. tiché dohody mezi zúčastněnými hráči. V experimentálním prostředí může ke spolupráci dojít, i pokud účastníci vědí, kolik kol se bude hrát.[6]
V experimentální studii z roku 2019 zveřejněné v odborném časopise American Economic Review se testovalo, jaké strategie lidé reálně volí v situacích iterovaného vězňova dilematu s dokonalým monitorováním. Výsledky studie ukázaly, že většina strategií, které lidé vybrali, byla zradit, pomstít se nebo spolupracovat tak dlouho, dokud spolupracuje druhý hráč. Volba strategie závisela na parametrech hry.[7]
Lidské chování ve vězňově dilematu
Experiment na základě tohoto jednoduchého dilematu prokázal, že přibližně 40 % účastníků hrálo kooperativně (tzn. odmítli vypovídat).[zdroj?]
Příklady z reálného života
Mnoho lidských interakcí a přírodních procesů má výplatní matice podobné vězňově dilematu. Tato hra je proto zajímavá jak pro společenské vědy jako ekonomie, politika nebo sociologie, tak pro přírodní vědy jako etologie nebo evoluční biologie. Mnoho přírodních procesů bylo abstrahováno do modelů, v nichž se živé bytosti účastní nekonečných her vězňova dilematu.
Studium životního prostředí
Ve studiu životního prostředí se toto dilema projevuje v krizových situacích, jako je globální změna klimatu. Má se za to, že ze stabilního klimatu budou mít prospěch všechny země, ale každá jednotlivá země často váhá omezit emise CO2. Okamžitý přínos z pokračování v současném chování je pro kteroukoli zemi vnímán jako větší než údajný výsledný přínos pro tuto zemi, pokud by došlo ke změně chování všech zemí. To vysvětluje patovou situaci týkající se změny klimatu, ke které došlo v roce 2007.[8]
Podstatným rozdílem mezi politikou související se změnou klimatu a vězňovým dilematem je nejistota. Nejsou známy rozsah ani rychlost, jakými může znečištění změnit klima. Dilema, kterému čelí vlády, se proto od vězňova dilematu liší tím, že nejsou známy výhody spolupráce. Tento rozdíl indikuje, že státy budou ve skutečnosti spolupracovat mnohem méně, než by spolupracovaly v opravdovém iterovaném vězňově dilematu. Pravděpodobnost, že se státy vyhnou klimatické katastrofě, je tak mnohem nižší, než vychází z herně-teoretické analýzy situace pomocí skutečného iterovaného vězňova dilematu.[9]
Thomas Osang a Arundhati Nandyová přicházejí s teoretickým vysvětlením opřeným o důkazy pro situaci, kdy regulace vede k zisku pro obě strany – podle hypotézy Michaela Portera, ve které jsou podstatné vládní regulace konkurenčních firem.[10]
Zvířata
Kooperativní chování řady zvířat lze chápat jako příklad iterovaného vězňova dilematu. Zvířata často žijí v dlouhotrvajících uskupeních. Například živorodky duhové společně hlídají, zda je v okolí predátor, a předpokládá se, že nespolupracující jedince trestají.[11]
Upíři jsou společenská zvířata, která si vzájemně vyměňují potravu. Aplikování poznatků z vězňova dilematu může toto chování pomoct vysvětlit.[12]
Ekonomie
Vězňovu dilematu se někdy přezdívá E. coli sociální psychologie a hodně se používá k výzkumu různých témat, například oligopolní konkurence nebo kolektivního jednání, za účelem produkce veřejného statku.[13]
Jako skutečný příklad vězňova dilematu se někdy uvádí reklama. Když byly ve Spojených státech ještě legální reklamy na cigarety, konkurenční výrobci cigaret se museli rozhodnout, kolik peněz investují do reklamy. Účinnost reklamy od firmy A byla částečně závislá na reklamě od firmy B. Stejně tak zisk z reklamy pro firmu B byl ovlivněn reklamou od firmy A. Pokud se firma A i firma B rozhodnou v daném období investovat do reklamy, pak reklama jedné firmy zneguje reklamu druhé firmy, příjmy zůstanou konstantní a náklady se zvýší kvůli nákladům na reklamu. Obě firmy by profitovaly z omezení reklamy. Pokud by se však firma B rozhodla nedělat reklamu, firma A by ze své reklamy mohla výrazně profitovat. Optimální investice do reklamy každopádně závisejí na tom, kolik do reklamy investuje druhá firma. Protože nejlepší strategie závisí na tom, pro co se rozhodne druhá firma, neexistuje zde žádná dominantní strategie. Tím se tento případ mírně liší od vězňova dilematu. Výsledek je mu však podobný v tom, že by na tom obě firmy byly lépe, pokud by investovaly do reklamy méně, než do ní investují v rovnovážném stavu.
Kooperativní jednání se někdy objevuje v obchodních situacích. Výrobci cigaret například podpořili přijetí zákonů, které zakazují reklamy na cigarety, protože si uvědomovali, že to v celém odvětví sníží náklady a zvýší zisky.[14]
[pozn. 1]
Členové kartelu jsou při absenci vymahatelných smluv také zapojeni do vězňova dilematu (ovšem o více hráčích).[15] „Spolupracovat“ obvykle znamená souhlasit s minimální cenou, zatímco „zradit“ znamená prodávat pod touto minimální cenou, což okamžitě ubírá obchody ostatním členům kartelu. Antimonopolní úřady chtějí, aby se potenciální členové kartelu navzájem zrazovali, protože se tím pro spotřebitele zajistí nejnižší možné ceny.
Sport
Doping ve sportu je uváděn jako další příklad vězňova dilematu. Dva soupeřící sportovci mají možnost použít nelegální a/nebo nebezpečnou drogu, aby zvýšili svůj výkon. Pokud ani jeden ze sportovců drogu nepoužije, ani jeden nezíská výhodu. Pokud ji použije pouze jeden z nich, pak tento sportovec získá nad svým soupeřem značnou výhodu, která je však snížena o právní a/nebo zdravotní riziko plynoucí z užití této drogy. Pokud si ale drogu vezmou oba sportovci, ani jeden nezíská výhodu a zůstane pouze riziko, čímž se oba dostávají do horší pozice, než kdyby vůbec nedopovali.[16]
Mezinárodní politika
V teorii mezinárodních vztahů se vězňovo dilema často používá k ilustraci toho, proč spolupráce selhává v situacích, ve kterých je spolupráce mezi státy celkově výhodná, ale z pohledu jednotlivých zemí je nevýhodná.[17][18] Typickým příkladem je bezpečnostní dilema, kdy zvýšení bezpečnosti v jedné zemi (například posílení její vojenské síly) vede ostatní země k obavám o vlastní bezpečnost ze strachu před napadením.[18] V důsledku toho mohou opatření ke zvýšení bezpečnosti vést k napětí, eskalaci situace nebo ke konfliktu s jednou nebo více dalšími stranami, což může vést k výsledku, který si žádná ze stran ve skutečnosti nepřeje.[18][19][20][21][22] Bezpečnostní dilema je obzvláště vyhrocené v situacích, kdy je obtížné odlišit útočné zbraně od obranných, přičemž útok je v každém konfliktu ve výhodě nad obranou.[18]
Vězňovo dilema je často používáno realistickými teoretiky mezinárodních vztahů k vysvětlení toho, proč všechny státy (bez ohledu na jejich vnitřní politiku nebo deklarovanou ideologii) budou mít problém spolupracovat za podmínek mezinárodní anarchie, přestože by z takové spolupráce měly všechny prospěch.
Kritici realismu mají za to, že opakování a prodlužování stínu budoucnosti jsou řešením vězňova dilematu. Když hráči vězňovo dilema hrají jednou, jsou motivováni ke zradě, zatímco pokud očekávají, že se hra bude hrát opakovaně, mají větší motivaci ke spolupráci.[23]
Dilemata s více hráči
Mnoho dilemat ve skutečném životě zahrnuje více hráčů.[24] Ačkoli se jedná o metaforu, pojem Garretta Hardina – tragédie obecní pastviny – může být považován za příklad zobecněného vězňova dilematu s více hráči. Každý vesničan se rozhoduje mezi osobním ziskem a zdrženlivostí. Kolektivní odměnou za jednomyslnou nebo častou zradu jsou nízké výnosy a zničení obecní pastviny.
Obecní pastviny nejsou vždy vykořisťovány: William Poundstone popisuje ve své knize o vězňově dilematu situaci na Novém Zélandu, kde se nezamykají stánky s novinami. Lidé si mohou vzít noviny bez zaplacení (zradit), ale jen málokdo to udělá, protože lidé cítí, že pokud sami nezaplatí, nebudou platit ani ostatní, což by zničilo systém, na bázi kterého to funguje.[25] Následný výzkum Elinor Ostromové, laureátky Nobelovy pamětní ceny za ekonomii z roku 2009, předpokládal, že tragédie obecní pastviny je příliš zjednodušená a že negativní výsledek je ovlivněn vnějšími faktory. Bez těchto komplikujících vlivů spolu skupiny komunikují a samy spravují společné zdroje tak, aby z nich měli prospěch, přičemž prosazují sociální normy tak, aby byl zdroj zachován a aby bylo dosaženo maximálního užitku pro skupinu.[26][27]
Akademické prostředí
V akademickém prostředí se vězňovo dilema používá k ilustraci složitosti spolupráce a konkurence. Jedním z pozoruhodných příkladů je experiment, který v 80. letech 20. století ve třídě na Hamilton College provedl profesor sociologie Dan Chambliss. V roce 1981 přišel s tím, že pokud se žádný student nedostaví ke zkoušce, všichni studenti dostanou známku A. Pokud zkoušku ale přijde vykonat byť jediný student, ti, kteří nepřišli, dostanou známku F. V roce 1988 John Werner, tehdejší student prvního ročníku, úspěšně přesvědčil své spolužáky k bojkotu zkoušky, což demonstrovalo praktické uplatnění teorie her a konceptu vězňova dilematu.[28]
V roce 2013, téměř o 25 let později, se podobná věc stala na Univerzitě Johnse Hopkinse. Profesor Peter Fröhlich nastavil pravidla hodnocení tak, aby výsledky závěrečné zkoušky byly vyhodnoceny podle nejvyššího dosaženého výsledku. To znamenalo, že pokud by všichni studenti dosáhli stejného výsledku, všichni by dostali známku A. Studenti zapsaní ve Fröhlichových kurzech zorganizovali bojkot závěrečné zkoušky a zajistili, že ji nikdo nepsal. Výsledkem bylo, že všichni studenti dostali známku A, čímž úspěšně vyřešili vězňovo dilema vzájemně optimálním způsobem bez opakování.[29][30] Tyto příklady ukazují, jak lze vězňovo dilema využít v kontextu vzdělávání ke zkoumání kooperativního chování a strategického rozhodování.
Odkazy
Poznámky
- ↑ Tento argument pro rozvoj spolupráce prostřednictvím důvěry je uveden v knize The Wisdom of Crowds, kde se tvrdí, že kapitalismus na dlouhé vzdálenosti se mohl vytvořit kolem jádra kvakerů, kteří se svými obchodními partnery vždy jednali čestně (místo aby zradili a nedodrželi své sliby, což byl jev, který dříve odrazoval od dlouhodobých nevymahatelných zámořských smluv). Má se za to, že obchodování se spolehlivými obchodními partnery umožnilo šíření memu spolupráce mezi další obchodníky, kteří ho šířili dál, až se vysoká míra spolupráce stala obecně v obchodě výnosnou strategií.
Reference
V tomto článku byl použit překlad textu z článku Prisoner's dilemma na anglické Wikipedii.
- ↑ VRÁNA, Jakub. Vězňovo dilema. PHP triky [online]. 2013-02-08 [cit. 2023-07-01]. Dostupné online.
- ↑ HOUSER, Pavel. Teorie her v praxi (2): vězňovo dilema na 100 kol [online]. 2008-01-04 [cit. 2023-07-01]. Dostupné online.
- ↑ GROFMAN, Bernard; POOL, Jonathan. www.tandfonline.com. 1977-01-01. Dostupné online [cit. 2025-01-06]. ISSN 0022-250X. DOI 10.1080/0022250x.1977.9989871.
- ↑ SHY, Oz. Industrial organization: theory and applications. Nachdr.. vyd. Cambridge, Mass.: MIT Press 466 s. ISBN 978-0-262-19366-5, ISBN 978-0-262-69179-6.
- ↑ AUMANN, Robert J. 16. Acceptable Points in General Cooperative n-Person Games. Příprava vydání Albert William Tucker, Robert Duncan Luce. [s.l.]: Princeton University Press Dostupné online. ISBN 978-1-4008-8216-8. DOI 10.1515/9781400882168-018. S. 287–324. (anglicky)
- ↑ COOPER, Russell; DEJONG, Douglas V.; FORSYTHE, Robert. Cooperation without Reputation: Experimental Evidence from Prisoner's Dilemma Games. Games and Economic Behavior. 1996-02-01, roč. 12, čís. 2, s. 187–218. Dostupné online [cit. 2025-01-06]. ISSN 0899-8256. DOI 10.1006/game.1996.0013.
- ↑ DAL BÓ, Pedro; FRÉCHETTE, Guillaume R. Strategy Choice in the Infinitely Repeated Prisoner’s Dilemma. American Economic Review. 2019-11-01, roč. 109, čís. 11, s. 3929–3952. Dostupné online [cit. 2025-01-07]. ISSN 0002-8282. DOI 10.1257/aer.20181480. (anglicky)
- ↑ Playing games with the planet. The Economist. Dostupné online [cit. 2025-01-07]. ISSN 0013-0613.
- ↑ REHMEYER, Julie. Game theory suggests current climate negotiations won’t avert catastrophe. Science News. 2013-09-23. Dostupné v archivu pořízeném z originálu dne 2019-04-02. (anglicky)
- ↑ Osang, Thomas; Nandyyz, Arundhati (srpen 2003). Environmental Regulation of Polluting Firms: Porter's Hypothesis Revisited.
- ↑ BROSNAN, Sarah F.; EARLEY, Ryan L.; DUGATKIN, Lee A. Observational Learning and Predator Inspection in Guppies (Poecilia reticulata). Ethology. 2003, roč. 109, čís. 10, s. 823–833. Dostupné online [cit. 2025-01-07]. ISSN 1439-0310. DOI 10.1046/j.0179-1613.2003.00928.x. (anglicky)
- ↑ Dawkins, Richard (1976). The Selfish Gene. Oxford University Press.
- ↑ AXELROD, Robert. Effective Choice in the Prisoner's Dilemma. Journal of Conflict Resolution. 1980-03-01, roč. 24, čís. 1, s. 3–25. Dostupné online [cit. 2025-01-07]. ISSN 0022-0027. DOI 10.1177/002200278002400101. (anglicky)
- ↑ HENRIKSEN, Lisa. Comprehensive tobacco marketing restrictions: promotion, packaging, price and place. Tobacco Control. 2012-03-01, roč. 21, čís. 2, s. 147–153. PMID: 22345238. Dostupné online [cit. 2025-01-07]. ISSN 0964-4563. DOI 10.1136/tobaccocontrol-2011-050416. PMID 22345238. (anglicky)
- ↑ NICHOLSON, Walter. Intermediate microeconomics and its application. 8. ed. vyd. Fort Worth, Tex.: Dryden 605 s. (The Dryden Press series in economics). ISBN 978-0-03-025916-6.
- ↑ SCHNEIER, Bruce. Lance Armstrong and the Prisoners' Dilemma of Doping in Professional Sports. Wired. Dostupné online [cit. 2025-01-07]. ISSN 1059-1028. (anglicky)
- ↑ SNYDER, Glenn H. "Prisoner's Dilemma" and "Chicken" Models in International Politics. International Studies Quarterly. 1971-03, roč. 15, čís. 1, s. 66. Dostupné online [cit. 2025-01-08]. DOI 10.2307/3013593.
- ↑ a b c d JERVIS, Robert. Cooperation under the Security Dilemma. World Politics. 1978-01, roč. 30, čís. 2, s. 167–214. Dostupné online [cit. 2025-01-08]. ISSN 1086-3338. DOI 10.2307/2009958. (anglicky)
- ↑ Herz, John H. (1950). Idealist Internationalism and the Security Dilemma. s. 157-180.
- ↑ SNYDER, Glenn H. The Security Dilemma in Alliance Politics. World Politics. 1984-07, roč. 36, čís. 4, s. 461–495. Dostupné online [cit. 2025-01-08]. ISSN 1086-3338. DOI 10.2307/2010183. (anglicky)
- ↑ JERVIS, Robert. Perception and misperception in international politics. Princeton, N.J: Princeton University Press 445 s. ISBN 978-0-691-05656-2, ISBN 978-0-691-10049-4.
- ↑ GLASER, Charles L. Rational theory of international politics: the logic of competition and cooperation. Princeton: Princeton University Press 314 s. ISBN 978-0-691-14372-9, ISBN 978-1-4008-3513-3.
- ↑ AXELROD, Robert; HAMILTON, William D. The Evolution of Cooperation. Science. 1981-03-27, roč. 211, čís. 4489, s. 1390–1396. Dostupné online [cit. 2025-01-08]. DOI 10.1126/science.7466396.
- ↑ Gokhale CS, Traulsen A. Evolutionary games in the multiverse. Proceedings of the National Academy of Sciences. 23. 3. 2010. 107(12):5500–04.
- ↑ POUNDSTONE, William. Prisoner's Dilemma. Westminster: Knopf Doubleday Publishing Group 1 s. ISBN 978-0-385-41580-4, ISBN 978-0-307-76378-5.
- ↑ SOMIN, Ilya. Elinor Ostrom and the Tragedy of the Commons [online]. 2009-10-13 [cit. 2025-01-08]. Dostupné online. (anglicky)
- ↑ OSTROM, Elinor. Governing the Commons: The Evolution of Institutions for Collective Action. Cambridge: Cambridge University Press (Canto Classics). Dostupné online. ISBN 978-1-107-56978-2. DOI 10.1017/cbo9781316423936. DOI: 10.1017/CBO9781316423936.
- ↑ BUDRYK, Zack. Game of Theories. Inside Higher Ed [online]. [cit. 2025-01-08]. Dostupné online. (anglicky)
- ↑ RAMPELL, Catherine. Gaming the System. Economix Blog [online]. 2013-02-14 [cit. 2025-01-08]. Dostupné online. (anglicky)
- ↑ MONROE, Rachel. Baltimore Fishbowl | Johns Hopkins Students Boycott Final Exam - So Everyone Gets an A -. Baltimore Fishbowl [online]. 2013-02-25 [cit. 2025-01-08]. Dostupné online. (anglicky)
Externí odkazy
- Obrázky, zvuky či videa k tématu Vězňovo dilema na Wikimedia Commons
- Heslo: Vězňovo dilema dostupné online na Stanford Encyclopedia of Philosophy (anglicky)