Bayesovská hra

Bayesovské hry jsou takové modely teorie her, které nemají omezení předpokladu kompletní informace, tedy nevyžadují úplnou znalost pravidel všemi hráči. Poprvé byly definovány v práci Johna C. Harsanyi.[1][2][3]

Teorie her z uvedení bayesovských her silně profitovala, protože ve většině reálných situací hráči nemají kompletní informace o situaci, ve které se nacházejí, ať už se to týká charakteristik ostatních hráčů, informacích o výsledcích her anebo vlastních alternativ v určitém bodě hry. Asymetrie informací je běžným aspektem, který se pomocí běžných konceptů teorie her také nedá simulovat.

Podrobněji

Bayesovský přístup k modelování neurčitosti spočívá v přiřazení subjektivního pravděpodobnostního rozdělení pro charakteristiky, které hráči nejsou s určitostí známé. Každý hráč si takto vytvoří určitý předpoklad o charakteristikách ostatních hráčů. Předpoklady ostatních hráčů o konkrétním hráči jsou mu též neznámé, jinými slovy neví, co vědí hráči ostatní. Vzhledem k tomu, že předpoklady ostatních hráčů představují důležitou informaci, která ovlivňuje chování hráče, musí hráč vytvořit očekávání o očekáváních ostatních hráčů. Chování hráče však není ovlivnitelné pouze očekáváními o charakteristikách ostatních hráčů, očekáváním o očekáváních ostatních hráčů, ale i tím, jaká jsou očekávání o očekáváních o očekáváních ostatních hráčů. Takovýto způsob analýzy by vedl k nekonečné řadě pravděpodobnostních rozdělení a z toho výplývajícím rozsáhlým a komplikovaným modelům.

[1] Harsanyi jako první představil návrh transformovat hru s nekompletními informacemi na hru s informacemi kompletními, ale nedokonalými. V bayesovských hrách je neurčitost o určité charakteristice modelována jako její pravděpodobnostní rozdělení. Neurčitost o charakteristikách ostatních hráčů je v bayesovských hrách vyjádřená pomocí neurčitosti o užitkových funkcích ostatních hráčů. Celkové soukromé informace o charakteristikách hráče ovlivňují jeho užitek a určují jeho typ. V instanci hry pozná každý hráč svůj vlastní typ, ale nepozná typy ostatních hráčů. Společné pravděpodobnostní rozdělení, podle kterého jsou na začátku hry hráčům přiřazené jejich typy, je v bayesovské hře informací veřejnou. Jestliže o konkrétních typech, které byly přiřazeny hráčům náhodnými tahy na začátku hry, nemají hráči informace, jedná se o typ hry s nedokonalými informacemi. Pravidla pro bayesovské hry se mírně odlišují od všeobecné definice her:

Bayesovská hra je složena z následujících elementů[1]:

  • množina hráčů
  • akční prostor , kde představuje množinu akcí hráče pro
  • prostor typy , kde je množina typů hráče pro
  • pravděpodobnostní rozdělení typů . Konkrétní typ hráče bude označovaný jako
  • užitková funkce , která každé uspořádané dvojici přiřadí hodnotu z pro

Bayesovská hra je v této podobě rozšířením hry v strategickém tvaru o typy hráčů, rozdělení těchto typů a vyžaduje si i upravení užitkové funkce. Pouze poznamenejme, že odvození bayesovské hry v extenzivní formě je obdobné.

Strategie představuje vyčerpávající akční plán. V bayesovských hrách musí tedy každý hráč připravit svojí akci v závislosti na typu, který mu bude v konkrétní instanci hry známý. Strategií se proto v bayesovských hrách myslí systém uspořádaných dvojic pro , anebo jinak funkcí z prostoru typů do prostoru akcí .[4] Důsledkem toho je, že se hráč může chovat v případě různých typů různě. Poněvadž hráč zná svůj vlastní typ ještě předtím, než vykoná svoje rozhodnutí, může se zdát určení akcí pro každý typ zvlášť redundantní. Ale typ určitého hráče není s určitostí znám ostatním hráčům. Proto jsou jejich rozhodnutí závislé na očekávání, jak se bude daný hráč chovat ve všech typech a i na pravděpodobnostním rozdělení těchto typů.

Smíšená strategie hráče pro bayesovské hry představuje funkci z prostoru typů do pravděpodobnostního rozdělení na množině akcí . Pravděpodobnostní rozdělení při strategii a pravděpodobnost hraní akce hráčem , který má v dané hře typ se bude označovat jako . Strategický prostor bayesovské hry je označován jako .

Očekávaný užitek hráče pro smíšený strategický profil a daný profil typů se vypočítá jako:

Očekávání hráče ohledně typu ostatních hráčů je vytvářené na základě pravděpodobnostního rozdělení a pravděpodobnost výskytu profilu typů se vyjadřuje jako . Poněvadž toto rozdělení je všem hráčům známé, předpokládá se, že jsou jejich očekávání navzájem konzistentní. Hráč zná svůj vlastní typ a pravděpodobnostní rozdělení všech typů, takže může pomocí Bayesova pravidla určit pravděpodobnost určité uspořádané (n-1)-tice typů ostatních hráčů: .

Hráči mají informaci o pravděpodobnosti výskytu typů ostatních hráčů, ale před začátkem hry neznají svůj vlastní typ. Jejich apriorní očekávaný užitek v instanci hry, v které se hráči chovají podle strategického profilu , se dá vyjádřit následovně:

Po zvolení typu hráče může hráč vypočítat svůj aposteriorní očekávaný užitek:

.

Bayesovo-Nashovo ekvilibrium

Tento koncept slouží k řešení bayesovských statických her. I naproti odlišné struktuře těchto her se základní idea Nashova ekvilibria nemění. Každá strategie v tomto ekvilibriu musí být nejlepší odpovědí hráče na strategii ostatních hráčů. Bayesovo-Nashovo equilibrium ve hře H s neúplnou informací je Nashovo equilibrium ve hře H s nejistou informací, která je reprezentací původní hry H.[5]

Strategický profil je Bayesovo-Nashovým ekvilibriem, jestliže platí jedna z dvou podmínek[2]:

  •                pro
  •    pro

Z definice vyplývá, že Bayesovo-Nashovo ekvilibrium se dá určit dvěma způsoby. Průběh Bayesovké hry je charakteristický výběrem typů jednotlivých hráčů na jejím začátku. Po úvodní sérii pravděpodobnostních tahů je každému hráči přiřazeny jeho typ a hráči hrají dále stejně jako v standardní statické hře. Poněvadž hráči znají svůj vlastní typ, ale neznají typ ostatních hráčů, tak nevědí s určitostí, v které hře se právě nacházejí. Vědí určit pravděpodobnostní rozdělení her na základě jejich přesvědčení vzhledem k typům ostatních hráčů. Bayesovo-Nashovo ekvilibrium představuje takový strategický profil, v kterém žádný z hráčů nemůže dosáhnout lepší očekávaný užitek ani pro jeden ze svých typů. Každá konečná hra s neúplnou informací má alespoň jedno Bayesovo-Nashovo equilibrium.[5]

Příklad - souboj pohlaví

preferuje společnost
ON Hokej ON Divadlo
ONA Hokej 2, 3 0, 0
ONA Divadlo 1, 1 3, 2

Bayesovo-Nashovo ekvilibrium si můžeme demonstrovat na známé hře souboj pohlaví. Nejdřív si ukažme standardní situaci (nalevo) řešenou pomocí Nashova equilibria. Manželská dvojice se rozhoduje, jak stráví večer. Má dvě možnosti: jít na hokejový zápas nebo do divadla. Oba manželé preferují společně strávený večer, ovšem ON dává přednost hokeji, zatímco ONA by raději zvolila návštěvu divadla. V tabulce ve tvaru dvoumatice jsou zaznamenány preference manželů v podobě výplat (uspokojení ze zvolené činnosti). U této hry bychom Nashova ekvilibria nalezli dvě (2, 3) a (3, 2) tedy trávit čas společně.

preferuje samotu
ON Hokej ON Divadlo
ONA Hokej 2, 1 0, 2
ONA Divadlo 1, 3 3, 0

Tabulka "preferuje samotu" ukazuje druhý typ hráče ON. Vyznačuje se stejnou užitkovou funkcí pro hráče ONA, ale ON tu má preference jiné. ON sice stále preferuje hokej před divadlem, nicméně v tomto případě chce jít sám. Hráč ONA nemá informace o tom jaký typ v této hře ON představuje, nicméně má přesvědčení, že ON z 80% preferuje společný večer a z 20% samotu. Tato hra se dá znázornit jako asociovaná hra v strategickém tvaru.[6]

Asociovaná hra
ON HokejHokej ON HokejDivadlo ON DivadloHokej ON DivadloDivadlo
ONA Hokej 2, 2.6 1.6, 2.8 0.4, 0.2 0, 0.4
ONA Divadlo 1, 1.4 1.4, 0.8 2.6, 2.2 3, 1.6

Zde nalezneme 2 čistá Nashova equilibria a to (1.6, 2.8) a (2.6, 2.2). Ty představují tyto dva stavy:

  • pokud jde ON při společenské náladě na hokej a při nespolečenské do divadla je pro hráče ONA racionální jít na hokej
  • pokud jde ON při společenské náladě do divadla a při nespolečenské na hokej je pro hráče ONA racionální jít do divadla

Dokonalé Bayesovo ekvilibrium

[7] Dokonalé Bayesovo ekvilibrium je vylepšením Nashova ekvilibria pro případ dynamických her s nedokonalými informacemi. Dynamické hry jsou hry v extenzivním tvaru. Kvůli tomu, aby se ekvilibrium nemuselo omezovat pouze na sekvenční podmínky v rámci pod-her, byl zaveden pojem přesvědčení. Přesvědčení přiřazuje pravděpodobnost vrcholu v rámci jedné informační množiny, což umožňuje výpočet očekávaného užitku i pro podstromy začínající ve vrcholu patřícímu do více početné informační množiny. Explicitní určení přesvědčení umožňuje ne jen stanovení dodatečných formálních požadavků vylepšující racionalitu ekvilibria, ale i posouzení přípustnosti ekvilibria s ohledem na dodatečné kritérium a jejich opodstatnění v realitě. Strategický profil se dá chápat jako scénář a pravděpodobnost scénáře by měla korespondovat s přesvědčeními zodpovídajícími danému ekvilibriovému profilu.

Hráči mají v každé informační množině určité přesvědčení o tom, s jakou pravděpodobností se nacházejí ve vrcholu . Přesvědčení je tedy funkce, která přiřazuje každému vrcholu v informační množině číslo z intervalu [0;1]. Přitom platí, že součet pravděpodobností pro vrcholy v jedné informační množině se rovná 1. Pravděpodobnostní rozdělení pro všechny informační množiny vytvářejí systém přesvědčení . Přesvědčení jsou explicitně určené jako součást ekvilibria a spolu se takto uspořádaná dvojice složená ze systému přesvědčení a ze strategického profilu bude označovat jako přiřazení . Sekvenční racionalita, která je základní vlastností tohoto ekvilibria, intuitivně znamená, že každé rozhodnutí musí být součástí ekvilibria pro zbytek hry a to pro začátek z kteréhokoliv vrcholu stromu hry pro dané přesvědčení. Teda i z vrcholů, které leží ve více početných informačních množinách. Formálně se sekvenční racionalita dá vyjádřit následující podmínkou:

      pro .

Při ekvilibriových strategiích je důležitou vlastností konzistentnost přesvědčení vzhledem na Bayesovu větu. je pravděpodobnost, že vrchol bude dosáhnutý, pokud se budou hráči chovat podle behaviorálního strategického profilu . Podobně je pravděpodobnost dosáhnutí informační množiny, v které se nachází, při hraní strategického profilu .

Dokonalé Bayesové ekvilibrium je přiřazení , které splňuje následující podmínky:

  • je sekvenčně racionální v každém vrcholu
  • přesvědčení jsou konzistentní vzhledem na Bayesovu větu vždy, když je to možné
  • strategický profil je vzhledem na pod-hry dokonalý

Reference

  1. a b c HARSANYI, John C. Games with incomplete information played by "Bayesian" Players, Part I. The Basic Model. U.S.A: Management Science Vol. 14, No. 3, 1967. (anglicky) 
  2. a b HARSANYI, John C. Games with incomplete information played by "Bayesian" Players, Part II. Bayesian Equilibrium Points. U.S.A: Management Science Vol. 14, No. 5, 1968. (anglicky) 
  3. HARSANYI, John C. Games with incomplete information played by "Bayesian" Players, Part III. The Basic probability distribution of the game. U.S.A: Management Science Vol. 14, No. 7, 1968. (anglicky) 
  4. MYERSON, Roger B. Game Theory: Analysis of Conflict. Cambridge, Massachusetts AND London: England: Harvard University Press, 1991. Dostupné online. (anglicky) 
  5. a b HYKŠOVÁ, Magdalena. Teorie her & optimální rozhodování - výukový text [online]. [cit. 2009-01-23]. Dostupné v archivu pořízeném dne 2018-10-12. 
  6. PEKÁR, Ján. Teória nekooperatívnych hier [online]. [cit. 2009-01-23]. Dostupné online. [nedostupný zdroj]
  7. GIBBONS, Robert. Game Theory for Applied Economists. Princeton: New Jersey: Princeton Universsity Press, 1992. Dostupné online. (anglicky) 

Read other articles:

Sirkuit Las Vegas StripLokasiLas Vegas, Nevada, Amerika SerikatZona waktuUTC−08:00Kapasitas100,000Broke groundMaret 2022; 2 tahun lalu (2022-03)Dibuka16 November 2023; 4 bulan lalu (2023-11-16)ArsitekCarsten Tilke[1]Acara besarSaat ini:Formula SatuGrand Prix Las Vegas(2023)Sirkuit Grand Prix (2023)PermukaanAspalPanjang6.201 km (3.853 mi)Tikungan17Rekor lap1:35.490 ( Oscar Piastri, McLaren-Mercedes, 2023, Formula Satu) Sirkuit Las Vegas Strip adalah lokasi perlombaan dari G...

 

Military operation Operation Dawn of Gulf of AdenPart of Piracy in Somalia, Operation Ocean Shield, Operation Enduring Freedom – Horn of AfricaSouth Korean commandos raid the chemical tanker, MV Samho Jewelry, during Operation Dawn of Gulf of Aden.Date18–21 January 2011[1]LocationArabian Sea, near the Gulf of Aden14°30′N 56°30′E / 14.5°N 56.5°E / 14.5; 56.5Result South Korean victory All 21 hostages safely rescuedBelligerents  Republic of Korea...

 

Bagian kecil dari nebula emisi NGC 6357. Bagian ini bersinar dengan karakteristik merah daerah H II.[1] Awan antar bintang adalah nama umum yang diberikan pada akumulasi gas, plasma dan debu di dalam sebuah galaksi. Awan antarbintang adalah daerah yang kerapatannya di atas rata-rata kerapatan medium antarbintang. Bergantung pada kerapatan, ukuran dan suhu, hidrogen yang ada di dalamnya dapat berwujud netral (daerah H I), terionisasi (daerah H II) dalam bentuk plasma, atau molekul (awa...

العلاقات اليابانية الزيمبابوية اليابان زيمبابوي   اليابان   زيمبابوي تعديل مصدري - تعديل   العلاقات اليابانية الزيمبابوية هي العلاقات الثنائية التي تجمع بين اليابان وزيمبابوي.[1][2][3][4][5] مقارنة بين البلدين هذه مقارنة عامة ومرجعية للدولتي�...

 

Antonello Falqui durante le registrazioni del programma televisivo Teatro 10 (1971) con Alberto Lupo (a sinistra) e Domenico Modugno (a destra) Antonello Falqui (Roma, 6 novembre 1925 – Roma, 15 novembre 2019[1]) è stato un regista e autore italiano di programmi televisivi, in special modo di varietà. Indice 1 Biografia 2 Opere 2.1 Rubriche e attualità (regista e autore) 2.2 Prosa teatrale (regista) 2.3 Prosa televisiva (regista e autore) 2.4 Spettacoli musicali e varietà 2.5 Ra...

 

Cuisine of the Javanese people, Indonesia This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Javanese cuisine – news · newspapers · books · scholar · JSTOR (January 2024) (Learn how and when to remove this template message) Tumpeng cone shaped rice surrounded with chicken, omelette eggs, sambel goreng ati (beef...

American politician For other people named Paul Morton, see Paul Morton (disambiguation). Paul Morton36th United States Secretary of the NavyIn officeJuly 1, 1904 – June 30, 1905PresidentTheodore RooseveltPreceded byWilliam MoodySucceeded byCharles Bonaparte Personal detailsBorn(1857-05-22)May 22, 1857Detroit, Michigan, U.S.DiedJanuary 19, 1911(1911-01-19) (aged 53)New York City, New York, U.S.Political partyRepublicanChildrenPauline SabinParentJulius Sterling Morton (father)S...

 

Urban contemporary radio station in Detroit WJLBDetroit, MichiganUnited StatesBroadcast areaMetro DetroitFrequency97.9 MHz (HD Radio)Branding97.9 WJLBProgrammingFormatUrban contemporaryAffiliationsiHeartRadioPremiere NetworksOwnershipOwneriHeartMedia, Inc.(iHM Licenses, LLC)Sister stationsWDFN, WLLZ, WKQI, WMXD, WNICHistoryFirst air dateMay 24, 1941; 82 years ago (1941-05-24)Former call signsW49D (1941–1943)WLOU (1943–1947)WJLB-FM (1947–1952)WBRI (1952–1957)WJLB-FM (...

 

Medium-range air-to-air missile K-8AA-3 Anab TypeMedium-range air-to-air missilePlace of originSoviet UnionService historyIn service1960-1992Used bySoviet Air Defense ForcesProduction historyDesignerMatus BisnovatManufacturerKaliningrad Series Production PlantSpecifications (R-98MR)Mass292 kg (644 lb)Length4.3 m (14 ft)Diameter280 mm (11 in)WarheadBlast fragmentationWarhead weight40 kg (88 lb)EngineSolid-fuel rocketOperationalra...

Questa voce sull'argomento strade degli Stati Uniti d'America è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Interstate 89LocalizzazioneStato Stati Uniti Stati federati New Hampshire Vermont DatiClassificazioneAutostrada InizioConcord (New Hampshire) FineHighgate Springs Lunghezza307,58 km DirezioneSud-Nord Data aperturaAnni 1950 PercorsoPrincipali intersezioni I-93 a Concord, NH Manuale L'Interstate 89 (I-89) è un'autostrada statunit...

 

Eastern Native American ceremonial dance Southeastern turtleshell rattles, worn on the legs while dancing, c. 1920, Oklahoma History Center The stomp dance is performed by various Eastern Woodland tribes and Native American communities in the United States, including the Muscogee, Yuchi, Cherokee, Chickasaw, Choctaw, Delaware, Miami, Caddo, Tuscarora, Ottawa, Quapaw, Peoria, Shawnee, Seminole,[1] Natchez,[2] and Seneca-Cayuga tribes. Stomp dance communities are active in Georg...

 

Medical conditionCarcinosarcomaMicrograph of a carcinosarcoma of the ovary. H&E stain, showing both carcinomatous and sarcomatous elementsSpecialtyOncology  Carcinosarcomas are malignant tumors that consist of a mixture of carcinoma (or epithelial cancer) and sarcoma (or mesenchymal/connective tissue cancer).[1] Carcinosarcomas are rare tumors, and can arise in diverse organs, such as the skin, salivary glands, lungs, the esophagus, pancreas, colon, uterus and ovaries.[1&...

Chronologies Données clés 1756 1757 1758  1759  1760 1761 1762Décennies :1720 1730 1740  1750  1760 1770 1780Siècles :XVIe XVIIe  XVIIIe  XIXe XXeMillénaires :-Ier Ier  IIe  IIIe Chronologies thématiques Art Architecture, Arts plastiques (Dessin, Gravure, Peinture et Sculpture), (), Littérature (), Musique (Classique) et Théâtre   Ingénierie (), Architecture et ()   Politique Droit et ()   Religion (,)   Sci...

 

Anouk GrinbergGrinberg pada 2014Lahir20 Maret 1963 (umur 61)Uccle, BelgiaPekerjaanPemeranTahun aktif1976–kini Anouk Grinberg (lahir 20 Maret 1963) adalah seorang pemeran asal Prancis.[1] Ia adalah putri dari Michel Vinaver, bernama lahir Michel Grinberg, seorang penulis dan pengarang drama asal Prancis, dan cicit dari politikus Rusia pra-1917 Maxim Vinaver. Ia tampil dalam lebih dari 40 film dan acara televisi sejak 1976. Pada 1996, ia memenangkan Silver Bear untuk Aktris...

 

 本表是動態列表,或許永遠不會完結。歡迎您參考可靠來源來查漏補缺。 潛伏於中華民國國軍中的中共間諜列表收錄根據公開資料來源,曾潛伏於中華民國國軍、被中國共產黨聲稱或承認,或者遭中華民國政府調查審判,為中華人民共和國和中國人民解放軍進行間諜行為的人物。以下列表以現今可查知時間為準,正確的間諜活動或洩漏機密時間可能早於或晚於以下所歸�...

Chinese scholar In this Chinese name, the family name is Lu. Lu JiuyuanLu JiuyuanBorn1139Died1192 Lu Jiuyuan (Chinese: 陸九淵; pinyin: Lù Jiǔyuān; 1139–1192), or Lu Xiangshan (陸象山; Lù Xiàngshān), was a Chinese philosopher and writer who founded the school of the universal mind, the second most influential Neo-Confucian school. He was a contemporary and the main rival of Zhu Xi. In East Asia and the Western World, he is known by his honorific name rather than his priva...

 

  لمعانٍ أخرى، طالع بانوراما (توضيح). بانوراما    خريطة الموقع تقسيم إداري البلد اليونان  [1] خصائص جغرافية إحداثيات 40°35′16″N 23°01′53″E / 40.587777777778°N 23.031388888889°E / 40.587777777778; 23.031388888889   الارتفاع 250 متر  السكان التعداد السكاني 17679 (resident population of Greece) (2021...

 

1949 Newfoundland general election ← 1932 (Dominion) May 27, 1949 1951 → 28 seats of the Newfoundland House of Assembly 15 seats were needed for a majority   First party Second party   Leader Joey Smallwood Harry Mews Party Liberal Progressive Conservative Leader's seat Bonavista North St. John's West(defeated) Seats won 22 5 Popular vote 110,459 54,728 Percentage 65.68% 32.54% Premier before election New Office Premier after election Joey Small...

Judy Garland nel 1957 mentre si trucca prima di uno spettacolo; è citata come una delle icone gay per eccellenza. Il termine icona gay definisce una figura storica, una celebrità o un personaggio pubblico contemporaneo che serve come referente (punto di riferimento e di riconoscimento per l'immaginario) in determinati ambiti della comunità lesbica, gay, bisessuale e transgender (LGBT). Alcune delle principali qualità di un'icona gay includono frequentemente la bellezza (il fascino carico ...

 

Andrea CoccoCocco con la maglia del Vicenza nel 2014Nazionalità Italia Altezza182 cm Peso75 kg Calcio RuoloAttaccante Squadra Trapani CarrieraGiovanili ????-2005 Cagliari Squadre di club1 2005-2007 Cagliari8 (1)2007→ Venezia9 (2)[1]2007-2008→ Pistoiese12 (1)[2]2008-2009 Rovigo21 (4)2009-2010 Alghero29 (15)2010-2012 AlbinoLeffe59 (17)[3]2012-2013 Verona17 (1)2013-2014→ Reggina18 (1)2014→ Beira-Mar12 (4...