Autokorelace

Autokorelace náhodných složek je jev, kterým ve statistice označujeme porušení Gauss-Markovova požadavku pro možnost odhadu regresních parametrů metodou nejmenších čtverců.

Matice kovariancí , která má při splnění nekorelovanosti náhodných složek tvar: , při autokorelaci vykazuje nenulové kovariance (tedy nediagonální prvky jsou nenulové). Platí, že je nám neznámý rozptyl náhodných složek a je jednotková matice řádu n.

Příčiny vzniku autokorelace

  1. chybná specifikace modelu - tzv. kvaziautokorelace
  2. přílišná aproximace v modelu (např. místo použijeme x apod.
  3. použití časově zpožděných proměnných v modelu
  4. zahrnutí chyb měření do vektoru u
  5. použití upravených dat - např. extrapolovaných, centrovaných, interpolovaných apod.

Důsledky autokorelace

  1. ztráta vydatnosti odhadu i asymptotické vydatnosti odhadu regresních parametrů
  2. i standardní chyby jsou vychýlené, R2 je nadhodnoceno, zatímco t-testy jsou slabé a rezidua jsou podhodnocená

Autokorelace prvního řádu

Tzv. autoregresní struktura prvního řádu:

zároveň platí následující vztah:

kde je tzv. autokorelační koeficient prvního řádu. Platí pro něj , protože jinak by měla rovnice explozivní charakter a byla by tak narušena homoskedasticita v matici . Nejsilnější korelace je vždy mezi dvěma sousedními vektory náhodných složek.

  • Pokud je , pak se jedná o pozitivní autokorelaci.
  • Pokud je , pak se jedná o negativní autokorelaci.
  • Pokud je , pak jsou složky vektorů a sériově nezávislé.

Testování výskytu autokorelace

Protože neznáme přesnou podobu vektoru náhodných složek u, pracujeme s vektory reziduí .

Durbinova-Watsonova statistika

Předpoklady použití testu

  1. úrovňová konstanta v modelu
  2. regresory nejsou stochastické proměnné

Testovací statistika

Pro výslednou charakteristiku nelze určit kritickou hodnotu, při které bychom odmítli hypotézu H0 při testování proti d-statistice. Postup vyhodnocení je následující:

  1. statistika dstřední hodnotu E(d) = 2 a nachází se v intervalu <0;4>
  2. stanovíme tabulkové hodnoty dD (dolní mez d) a dH (horní mez d) podle stupňů volnosti modelu
  3. porovnáme hodnotu d s následujícími intervaly a na základě pozice d vyhodnotíme autokorelaci:


  • Interval <0;dD> značí pozitivní autokorelaci
  • V intervalu <dD;dH> nemůžeme rozhodnout, zda se jedná o korelaci, či nikoliv
  • Interval <dH;2> poukazuje na statisticky nevýznamnou pozitivní autokorelaci
  • Interval <2;4-dH> poukazuje na statisticky nevýznamnou negativní autokorelaci
  • V intervalu <4-dH;4-dD> nemůžeme rozhodnout, zda se jedná o korelaci, či nikoliv
  • Interval <4-dD;4> poukazuje na statisticky významnou negativní autokorelaci

Watsonova statistika

Durbinovo h

  • použijeme právě tehdy, pokud se v modelu nachází zpožděná vysvětlovaná proměnná

Statistika h má následující podobu:

, kde j značí j-tou vysvětlující zpožděnou proměnnou za podmínky, že .

Statistiku h testujeme přes normované normální rozdělení N(0;1), kdy pro

  • předpokládáme sériovou nezávislost náhodných složek
  • usuzujeme na autokorelaci

Postup v případě identifikování autokorelace náhodných složek

  1. ověřit správnost modelu (jestli se nejedná o kvaziautokorelaci)
  2. logaritmování nebo semilogaritmování dat
  3. transformace dat v matici pozorování X pomocí matice T - tzv. Praisova-Winstenova transformace

což vyústí v následující podobu modelu, který již bude poskytovat při použití metody zobecněných nejmenších čtverců vydatné i asymptoticky vydatné odhady regresních parametrů:

Odkazy

Reference

  • Cochrane a Orcutt. 1949. "Application of least squares regression to relationships containing autocorrelated error terms". Journal of the American Statistical Association 44, str. 32–61

Literatura