Nezávislost je základní pojem teorie pravděpodobnosti, matematické statistiky a teorie stochastických procesů. Dva náhodné jevy jsou nezávislé, statisticky nezávislé nebo stochasticky nezávislé,[1] pokud výskyt jednoho nemá vliv na pravděpodobnost výskytu druhého (ekvivalentně řečeno, nemá vliv na šance výskytu druhého jevu). Podobně jsou dvě náhodné veličiny nezávislé, pokud realizace jedné neovlivní rozdělení pravděpodobnosti druhé. Definiční a často využívanou vlastností nezávislých jevů je, že pravděpodobnost jejich společného výskytu se rovná součinu pravděpodobností jejich výskytů. Opakem nezávislosti je statistická závislost, například korelace.
Pokud jde o soubor více než dvou jevů, je třeba rozlišovat slabé a silné pojetí nezávislosti. Jevy se nazývají po dvou nezávislé, pokud jsou jakékoli dva jevy v souboru nezávislé, a nezávislé (nebo kolektivně nezávislé), pokud každý jev je nezávislý na jakékoli kombinaci dalších jevů v souboru. Podobná definice platí pro soubory náhodných proměnných. Z (kolektivní) nezávislosti plyne nezávislost po dvou, ale naopak to neplatí.
Obecnějším konceptem je podmíněná nezávislost, která vyjadřuje, že dva náhodné jevy či veličiny A a B jsou nezávislé ve smyslu pravděpodobností podmíněných třetím náhodným jevem či veličinou Z. To neformálně řečeno znamená, že jakmile máme k dispozici informaci obsaženou v Z, není už další informace A užitečná pro přesnější poznání B ani znalost B nepřidá nic pro pochopení A, i kdyby A a B byly vzájemně závislé.
Příklady
Házení hrací kostkou: Jev, že padne 6 při prvním hodu kostkou a jev padnutí 6 při druhém hodu jsou nezávislé. Naproti tomu jev, že padne 6 při prvním hodu kostkou a jev, že součet čísel zaznamenaných v prvním a druhém pokusu je 8, nejsou nezávislé jevy.
Tahání náhodných karet z promíchaného balíčku: Pokud jsou z balíčku karet vytaženy dvě karty s vracením (první vytažená karta se vrátí do balíčku před tažením druhé karty), jsou jevy vytažení červené karty v prvním pokusu a vytažení červené karty ve druhém pokusu nezávislé. Naproti tomu pokud jsou dvě karty vytaženy bez vracení, událost tažení červené karty v prvním pokusu a událost tažení červené karty ve druhém pokusu nejsou nezávislé, protože po vytažení první červené karty balíček už obsahuje o jednu červenou kartu méně.
Dva náhodné jevy a jsou nezávislé (zapsáno nebo ) právě tehdy, pokud se pravděpodobnost jejich společného výskytu rovná součinu pravděpodobností jejich výskytů:[2]:s.p. 29[3]:s.p. 10
Proč se nezávislost definuje takto, je jasné po přepsání s použitím podmíněných pravděpodobností:
.
a podobně
.
To znamená, že výskyt nemá vliv na pravděpodobnost a naopak. Ačkoli se odvozené výrazy mohou zdát intuitivnější, nejedná se o upřednostňovanou definici, protože podmíněné pravděpodobnosti nemusejí být definované, pokud nebo jsou 0. Kromě toho upřednostňovaná definice je zjevně symetrická, takže je z ní vidět, že když je nezávislý na , tak je také nezávislý na .
.
Zobecnění na více jevů: Konečná množina jevů je po dvou nezávislá, pokud je každá dvojice jevů nezávislá — to znamená, že pro všechny vzájemně odlišné páry indexů
Konečná množina jevů je nezávislá, pokud je každý jev nezávislý na libovolném průniku ostatních jevů[3]:s.p. 11 — to znamená, že pro každé a pro každou -prvkovou podmnožina jevů z platí
Toto se nazývá pravidlo násobení pravděpodobností pro nezávislé jevy. Všimněte si, že nejde o jedinou podmínku zahrnující pouze součin všech pravděpodobností všech jednotlivých jevů; vzorec musí platit pro všechny podmnožiny dané množiny jevů.
Pro více než dva jevy je nezávislá množina jevů (podle definice) také nezávislá po dvou; ale opak nemusí nutně platit.[2]:s.p. 30
Náhodné veličiny
Dvě reálné náhodné veličiny a jsou nezávislé tehdy a právě tehdy, jsou-li prvky jimi generovaného π systému nezávislé; to znamená, že pro každé a jsou jevy a nezávislé (jak je definováno výše). Z toho plyne, že a s distribučními funkcemi a jsou nezávislé, pokud kombinovaná náhodná proměnná má kumulativní distribuční funkci[3]:s.p. 15
,
z čehož plyne, že pokud existují hustoty pravděpodobnosti a a společná hustota pravděpodobnosti , tak
.
Zobecnění na více než dvě náhodné veličiny:
Konečná množina náhodných veličin je po dvou nezávislá, jestliže je každá dvojice náhodných veličin z této množiny nezávislá.
Konečná množina náhodných veličin je nezávislá, jestliže pro jakoukoli posloupnost čísel jsou jevy vzájemně nezávislé (jak je definováno výše). To je ekvivalentní následující podmínce o společné distribuční funkci : množina je nezávislý právě tehdy, když[3]:s.p. 16
Všimněte si, že zde není nutné vyžadovat, aby rozdělení pravděpodobnosti faktorizovalo pro všechny možné podmnožiny prvků jako v případě pro jevů. Je to proto, že např. totiž implikuje atp.
Náhodné vektory
Dva reálné náhodné vektory a jsou nezávislé, pokud[4]:s.p. 187
,
kde a jsou distribuční funkce a a označuje jejich společnou distribuční funkci. Nezávislost a se často označuje . Rozepsáno po komponentách:
.
Stochastické procesy
Definici nezávislosti lze rozšířit z náhodných vektorů na stochastické procesy. Nezávislý stochastický proces je takový, u kterého náhodné veličiny získané jeho vzorkováním v libovolných časových okamžicích (pro libovolné přirozené ) jsou nezávislé náhodné veličiny.[5]:s.p. 163
Formálně zapsáno se stochastický proces nazývá nezávislý, právě když pro všechna a pro všechny
,
kde . Nezávislost stochastického procesu je jeho vnitřní vlastnost, nikoli vztah mezi dvěma různými stochastickými procesy.
Vzájemná nezávislost dvou stochastických procesů je vztah mezi dvěma stochastickými procesy a definovanými na stejném pravděpodobnostním prostoru . Formálně dva stochastické procesy a jsou považovány za nezávislé, pokud pro všechna a pro všechny jsou náhodné vektory a navzájem nezávislé,[6]:s.p. 515 tj. pokud
Vlastnosti
Nezávislost na sobě samém
Všimněte si, že jev je na sobě nezávislý právě tehdy, když
Jev je tedy na sobě nezávislý, právě když k němu skoro jistě dojde nebo skoro jistě nedojde (dojde k jeho doplňku); tato skutečnost je užitečná při dokazování různých vět, které tvrdí, že nějaký jev má buď pravděpodobnost jedna nebo nula, nic mezi (anglicky tzv. zero-one laws).
Pro jevy je podmíněná nezávislost definována takto:
Jevy a jsou podmíněně nezávislé vzhledem k jevu , když
.
Pro náhodné veličiny je definice podobná.
Neformálně řečeno jsou dvě náhodné veličiny a podmíněně nezávislé vzhledem k , pokud platí, že jakmile je známa hodnota , tak už nepřidá žádné další informace o . Například dvě měření a stejné hodnoty nejsou nezávislé, ale jsou podmíněně nezávislé vzhledem k (pokud chyby v obou měřeních nejsou nějakým způsobem spojeny).
Formální definice podmíněné nezávislosti je založena na myšlence podmíněného rozdělení Pokud , a jsou diskrétní náhodné veličiny, pak definujeme a jako podmíněně nezávislé vzhledem k, pokud
pro všechny , a takové, že . Dále pokud jsou náhodné proměnné spojité a mají společnou funkci hustoty pravděpodobnosti, pak a jsou podmíněně nezávislé vzhledem k , pokud
pro všechna reálná čísla , a taková, že .
Je-li diskrétní a jsou podmíněně nezávislé vzhledem k , pak
pro všechny , a při podmínce . To znamená, že rozdělení podmíněné a je stejné jako rozdělení podmíněné jen samotným . Podobná rovnice platí pro podmíněné funkce hustoty pravděpodobnosti v spojitém případě.
Nezávislost lze chápat jako zvláštní druh podmíněné nezávislosti, protože na pravděpodobnost lze pohlížet jako na zvláštní případ podmíněné pravděpodobnosti, pokud ji nepodmiňujeme žádným jevem.
Příklad podmíněné nezávislosti: Teplota a intenzita osvětlení na nějakém místě bývají korelovány, protože v noci a v zimě je obvykle méně světla a zároveň nižší teplota. Ze znalosti teploty tedy můžeme pomocí regresní analýzy upřesnit odhad intenzity osvětlení a naopak. Kdybychom však k pozorování teploty a intenzity osvětlení přidali ještě údaj o přesném čase, tak se může stát, že znalost teploty již (příliš) nevylepší odhad intenzity osvětlení nad rámec odhadu založeného na čase, takže osvětlení a teplota budou (téměř) statisticky nezávislé podmíněno časem.