Bayesova věta (alternativně Bayesova formule, Bayesův vzorec) je věta teorie pravděpodobnosti, která udává, jak podmíněná pravděpodobnost nějakého jevu souvisí s opačnou podmíněnou pravděpodobností.[1] Tj. například jak z pravděpodobnosti, že test vyjde negativně u nemocného člověka, vypočítat pravděpodobnost, že negativně testovaný člověk je nemocný.
V základní podobě řeší Bayesova věta následující typ úloh:
Pokud ve městě s tisíci obyvateli má 20 lidí danou nemoc a lékařský test se zmýlí u zdravého i u nemocného v 10% případů, pak z tohoto tisíce lidí vyjde pozitivně 90% z 20 = 18 nemocných lidí a 10% z 980 = 98 zdravých. Proto u náhodného testovaného člověka, který vyšel pozitivně, je pravděpodobnost, že je skutečně nemocný, , tj. necelých 16%.
Kdyby ovšem nemocných nebylo 20, ale 200 (tj. každý pátý), pak by měl test o něco větší průkaznost: pozitivně by vyšlo 80 z 800 zdravých lidí a 180 u 200 nemocných. Pravděpodobnost, že dotyčný je nemocný, by byla = 69%.
Kdyby byl nemocný každý pátý a test by byl spolehlivější, takže by se zmýlil (u zdravých a nemocných) jen ve 2% případů, pak by výsledek byl ještě průkaznější: = 92%.
Tato věta úzce souvisí s disciplínou matematiky zvanou testování statistických hypotéz. Ta udává, jak vypočítat pravděpodobnost, že nějakou hypotézu – např. že testovaný člověk je zdravý, nebo že dívky a hoši jsou stejně dobří v matematice) – mylně zamítneme, pokud platí, nebo že ji mylně přijmeme, pokud neplatí (ta ovšem závisí na tom, jak moc se hoši a dívky liší v matematických schopnostech). Z toho a z procenta nemocné populace pak Bayesova věta vypočítá, jak pravděpodobně může např. negativně testovaný člověk být nemocný.
Poprvé na tuto souvislost upozornil anglický duchovní Thomas Bayes (1702–1761) v posmrtně vydaném článku An Essay towards solving a Problem in the Doctrine of Chances (1763). Roku 1774 větu znovu objevil francouzský matematik a fyzik Pierre-Simon Laplace, nicméně postupně upadla v zapomnění a rozšířila se až v 2. polovině 20. století.[3] Frekvenční interpretace pravděpodobnosti se poté nazývá klasická či Laplaceova, právě podle Pierre-Simona Laplace.
Při počítání s Bayesovou formulí je výhodné znát následující úpravu, jelikož nemusíme znát pravděpodobnost náhodných jevů, nýbrž pouze jejich pravděpodobnosti podmíněné.
Tato formule spočívá ve vhodné úpravě jmenovatele, tedy
Tato forma Bayesovy věty vychází z předpokladu Bayesovy věty, tedy že platí . Lze ale vyjádřit pravděpodobnost -tého členu . Tedy získáváme upravenou verzi Bayesovy věty využívající doplněk. Pro rozložení podmíněné pravděpodobnosti na pravé straně rovnice lze využít větu o úplné pravděpodobnosti.
Mějme neslučitelné náhodné jevy , kde takové, že pro ně platí . Pak platí
Verzi věty lze z konečného počtu náhodných jevů rozšířit i na nekonečně spočetně jevů.
Přidání historie
Přidání jednoho prvku
Formu, která bere v potaz historii, lze odvodit zavedením substituce a dosazení do znění Bayesovy věty. Získáváme tedy
, z čehož získáváme vzorec
, ze kterého přeznačením (pro konzistenci) získáváme formu Bayesovy věty zobecňující prvek historie v následující podobě:
.
Přidání více prvků
Obdobným způsobem lze přidat konečně mnoho prvků historie , respektive i nekonečně spočetně. Můžeme definovat pomocí součtů jako (respektive ).
Tato forma Bayesovy věty může být užitečná, pokud v příkladu testování na drogy budu mít více testovaných lidí, pak obecně označíme výsledek -tého testu, tedy pokud byl první test pozitivní, výsledek do historie zaneseme například jako , pokud by byl negativní, pak bychom položili .
Výsledná forma zobecňující všechny výsledky má podobu
.
Šancová forma Bayesovy věty
Z definice šance lze odvodit vzorec poměrů pravděpodobností , který má tvar
, tedy slovně aposteriorní šance hypotézy proti hypotéze je rovna součinu apriorní šance hypotézy proti hypotéze a poměru věrohodností hypotézy proti hypotéze .
Bayesova věta pro spojité náhodné vektory
Bayesovu větu lze popsat i pomocí hustoty spojitých náhodných vektorů a . Tedy podmíněná hustota spojitého náhodného vektoru vzhledem k je rovna
Podobu Bayesovy věty pro spojité náhodné vektory lze odvodit dosazením vztahu do vztahu podmíněné hustoty vzhledem k , tedy .[6]
Konkrétní problémy: typografie; poslední odstavec napsat obecně a uvést v úvodu
V základní podobě věta řeší úlohy typu: Jistou nákazu má v milionovém městě tisíc lidí. Náhodný člověk byl otestován testem, který se zmýlí v 1% případů, a vyšel pozitivní. Jaká je pravděpodobnost, že je skutečně pozitivní? Podle věty řešení plyne z toho, že při otestování celého města by
Z onoho tisíce nemocných by pozitivně test vyšel 99% * 1000 = 990 lidem.
Z 999000 zdravých obyvatel vyšlo pozitivních 1% * 999000 = 9990.
Pravděpodobnost, že náhodný pozitivně testovaný člověk je nemocný, je proto , tj.zhruba 9,01%.
Věta tedy tvrdí, že k interpretaci výsledků různých testů (v nejrůznějších odvětvích vědy či lidské činnosti) je potřeba znát nejen výsledek pokusu, ale též mít nějaký názor (tzv. apriorní pravděpodobnost) na to, jak pravděpodobná je testovaná hypotéza. V takto vyhrocených případech může mít apriorní pravděpodobnost dokonce větší vliv na výslednou pravděpodobnost, než samotný výsledek experimentu. Intuitivně lze řešení pochopit tak, že argument pro hypotézu, že dotyčný je zřejmě zdravý (protože jeden z tisíce je nemocný) má v tomto příkladu „desetkrát větší váhu“, než argument pro nemoc (že test se zmýlí jen jedenkrát ze sta), a proto je desetkrát pravděpodobnější, že dotyčný je zdravý.
Věta se dá rozšířit mnoha způsoby, např. na libovolný konečný stavů: člověk může být zdravý, lehce nemocný, vážně nemocný či terminálně nemocný. Je-li dána apriorní pravděpodobnost každého z těchto stavů (např. zastoupení v populaci) a pravděpodobnost pozitivního výsledku pro lidi zdravé, lehce nemocné apod., výsledkem věty je pak aposteriorní pravděpodobnost jednotlivých zdravotních stavů. Není důležité, zda samotný test má více než dva možné výsledky, protože pro výpočet stačí uvážit dva: ten, který vyšel, a možnost, že by vyšel jakýkoli jiný.
Testování na drogy
Nyní si ukažme příklad použití Bayesova pravidla při testování na drogy. Vyjdeme z předpokladů, že test na prokázání drog má senzitivitu 99 % a specificitu 99 %. Test se na první pohled zdá být docela přesný, ale pomocí Bayesovy věty lze ukázat, že netriviální procento testovaných může být nesprávně označeno za uživatele drog. Nechť je v testovaném podniku prevalence 0,5 %, tj. 0,5 % ze zaměstnanců drogy opravdu užívá.
Jaká je pravděpodobnost, že osoba s pozitivním testem drogy opravdu používá?
Označme si uživatele drog jako "A", "N" všechny ostatní. Nechť "+" znamená pozitivní test. Popišme si následující veličiny:
pravděpodobnost, že osoba je uživatelem drog (prevalence), tj.
pravděpodobnost, že osoba není uživatelem drog; zjistíme pomocí doplňkového jevu, tzn.
pravděpodobnost, že test je pozitivní, když je osoba uživatelem drog; jinými slovy sensitivita testu:
je pravděpodobnost, že test bude pozitivní, i přesto, že osoba není uživatelem drog; lze interpretovat jako doplněk k specificitě testu:
je pravděpodobnost, že test bude pozitivní.
Pravděpodobnost sice zadanou nemáme, ale lze ji vypočítat dle výše zmíněné formule:
Po dosazení dostáváme výsledek 1,49 %:
Díky těmto údajům můžeme vypočítat žádanou pravděpodobnost pomocí Bayesovy věty:
Všimněme si, že i přes vysokou specificitu a senzitivitu je výsledek testu poměrně nepřesný. U zaměstnance podniku s pozitivním testem je jen 33% pravděpodobnost, že je skutečně uživatelem drog.
Specificita a senzitivita
Senzitivita testu (také citlivost testu) nám udává úspěšnost, s níž test zachytí přítomnost sledovaného stavu (nemoci) u daného subjektu. V našem příkladu to znamená, že test správně identifikuje skutečné uživatele drog v 99 % případů.
Specificita testu nám vyjadřuje úspěšnost, s níž test určí případy, u nichž zkoumaný stav (nemoc) nenastává. 99% specificita testu znamená, že test s 99% pravděpodobností správně vyloučí osobu, která drogy nepoužívá.
Bayesovská statistika
Bayesovská statistika je pokročilejší odvětví statistiky, které místo bodových odhadů parametrů z dat uvažuje nějaké pravděpodobnostní rozdělení nad možnými hodnotami parametru. To může být apriorní (známé již před získáním dat) nebo aposteriorní (apriorní rozdělení upravené informacemi zachycenými v datech). Matematicky se tento přechod od apriorního rozdělení a dat k aposteriornímu rozdělení formuluje pomocí podmíněných pravděpodobností a Bayesova věta tedy v bayesovské statistice přirozeně hraje klíčovou roli.
↑HRON, Karel; KUNDEROVÁ, Pavla; VENCÁLEK, Ondřej. Základy počtu pravděpodobnosti a metod matematické statistiky. Redakce Tereza Vintrová. 4., doplněné vyd. Olomouc: Univerzita Palackého v Olomouci, 2021. 346 s. ISBN978-80-244-5990-5. Kapitola Podmíněná pravděpodobnost, s. 37–38.
↑HRON, Karel; KUNDEROVÁ, Pavla; VENCÁLEK, Ondřej. Základy počtu pravděpodobnosti a metod matematické statistiky. Redakce Tereza Vintrová. 4., doplněné vyd. Olomouc: Univerzita Palackého v Olomouci, 2021. 346 s. ISBN978-80-244-5990-5. Kapitola Podmíněné rozdělení, s. 125.