A valószínűségszámítás elméletében és a statisztika területén, a k szabadságfokú khí-négyzet eloszlás (más neveken: khi-négyzet, Khi2) k darab független normális eloszlású valószínűségi változónak a négyzetösszege.
Ha szükséges a khí-négyzet eloszlást megkülönböztetni a nem-centrális khí-négyzet eloszlástól, akkor szokták néha centrális khí-négyzet eloszlásnak is nevezni.
A khí-négyzet eloszlást statisztikák ellenőrzésére használják, az elméleti és a megfigyelt értékek kiértékelésénél, összehasonlításánál.
A khí-négyzet eloszlás, a gamma-eloszlás egy speciális esete.
Definíció
Ha Z1, ..., Zk független, standard normális eloszlású valószínűségi változók, akkor a négyzeteik összege,
a khí-négyzet eloszlás szerint oszlik el, k szabadságfokkal.
Ezt a következőképpen is jelölik:
A khi-négyzet eloszlásnak egy paramétere van, a k, egy pozitív egész, mely a szabadságfok mértéke.
Valószínűség sűrűségfüggvény
A khí-négyzet eloszlás valószínűség sűrűségfüggvénye:
Ennek az eloszlásnak a táblázatai – rendszerint kumulatív formában – számos helyen megtalálhatók, általában statisztikai csomagokban. Egy zárt formájú közelítés található a nem-centrális khí-négyzet eloszlásnál.
Additivitás
A khí-négyzet eloszlás definíciója szerint a független khí-négyzet változók összege is khí-négyzet eloszlású.
Speciálisan, ha {Xi}i=1n független khí-négyzet eloszlású változók {ki}i=1n szabadságfokkal, akkor Y = X1 + ⋯ + Xn is khí-négyzet eloszlásúak k1 + ⋯ + kn szabadságfokkal.
Információ entrópiája
Az információ entrópiája:
ahol ψ(x) a Digamma-függvény.
A khí-négyzet eloszlás az X valószínűségi változó maximális entrópiájú valószínűség eloszlása, ahol rögzített, és is rögzített.[5]
Nem centrális momentumok
A k szabadságfokú khí-négyzet eloszlás zéró körüli momentumai:[6][7]
Kumulánsok
A kumulánsok a karakterisztikus függvény logaritmusának egy hatvány sor kiterjesztésével kaphatók:
Aszimptotikus tulajdonságok
A centrális határeloszlás tételéből következően, mivel a khi-négyzet eloszlás független k szabadságfokú valószínűségi változók szummája, véges átlaggal és szórásnégyzettel, konvergál a normális eloszláshoz nagy k értékeknél.
Praktikus okok miatt, k > 50 esetben az eloszlás elég közel áll a normális eloszláshoz, hogy a különbség elhanyagolható lehessen.[8]
Ha X ~ χ²(k), akkor k tart a végtelenhez, a eloszlás pedig a normális eloszlás felé tart.
Azonban ez a konvergencia lassú, mivel a ferdeség , és az eloszlásgörbe meredeksége 12/k.
A khí-négyzet eloszlás más függvényei jóval gyorsabban konvergálnak a normális eloszláshoz.
Néhány példa:
Ha X ~ χ²(k), akkor közel normálisan eloszlású, középértékkel.
Ha X ~ χ²(k), akkor közel normálisan eloszlású középértékkel, és szórásnégyzettel[9] Ezt Wilson-Hilferty transzformációnak hívják.
Khí-négyzet eloszlás, a Pareto-eloszlás egy transzformációja
A T-eloszlás, a khí-négyzet eloszlás egy transzformációja
A T-eloszlás származtatható a khi-négyzet eloszlásból, és a normális eloszlásból
Nem-centrális T-eloszlás származtatható a khí-négyzet eloszlásból, és a normális eloszlásból
Statisztikailag független egységnyi szórásnégyzetes Gauss-eloszlású változók négyzeteinek szummája, melynek nincs zéró középértéke, a khí-négyzet eloszlás általánosításához vezet, és nem-centrális khi-négyzet eloszlásnak hívják.
A khí-négyzet eloszlás természetesen kapcsolódik más eloszlásokhoz, melyeknek a Gauss-eloszláshoz van közük.
Például:
YF-eloszlású, Y ~ F(k1,k2) ha ahol X1 ~ χ²(k1), és X2 ~ χ²(k2) statisztikailag független.
Ha X1 ~ χ2k1 és X2 ~ χ2k2 statisztikailag független, akkor X1 + X2 ~ χ2k1+k2. Ha X1 and X2 nem függetlenek, akkor X1 + X2 nem khi –eloszlású.
Általánosítás
A khí-négyzet eloszlást a Gaussi k, független, zéró középértékű, egységnyi szórásnégyzetű valószínűségi változók négyzeteinek szummájával kapjuk.
Ennek az eloszlásnak az általánosítását úgy kaphatjuk, ha összegezzük más típusú Gaussi valószínűségi változók négyzeteit.
A következőkben bemutatunk néhány ilyen eloszlást.
Khí-négyzet eloszlások
Nem-centrális khí-négyzet eloszlás
A nem-centrális khí-négyzet eloszlást a független gaussi valószínűségi változók négyzeteinek szummájával kapjuk, melyek egység szórásnégyzettel , és nem zéró középértékkel rendelkeznek.
Általánosított khí-négyzet eloszlás
Az általánosított khí-négyzet eloszlást a z′Az kvadratikus képletéből kapjuk, ahol z, a zéró középértékű Gaussi vektor, tetszőleges kovariáns mátrixxal, és A egy tetszőleges mátrix.
A khí-négyzet eloszlásnak számos alkalmazása ismert a statisztikában, például a khí-négyzet teszt, vagy a szórásnégyzetek becslése. Felveti a normális eloszlás középérték becslésének a problémáját, és a regressziós vonal meredekségének a becslését, a T-eloszláson keresztül.
A szórásnégyet analízis problémájában is van szerepe, az F-eloszlással kapcsolatban, mely két független khí-négyzet valószínűségi változó arányának az eloszlása, mindegyik osztva a megfelelő szabadságfokkal.
A következő táblázat olyan eloszlásokat mutat be, melyek neve ‘khí’-vel kezdődik, valamilyen statisztikához kapcsolódik, a Xi ∼ Normal(μi, σ2i), i = 1, ⋯, k, független valószínűségi változókra alapozva:
Wilson, E.B – Hilferty, M.M: The distribution of chi-squared. Washington: Proceedings of the National Academy of Sciences. 1931. 684–688. o.
Horváth Gézáné: Kvantitatív módszerek I.Fejezetek a valószínűségszámításból. (hely nélkül): PERFEKT ZRT. 2005. ISBN 9789633945902
Jonhson, N.L.; S. Kotz, , N. Balakrishnan: Continuous Univariate Distributions (Second Ed., Vol. 1, Chapter 18). (hely nélkül): John Willey and Sons. 1994. ISBN 0-471-58495-9
Maddala, G.S: Limited-Dependent and Qualitative Variables in Econometrics. (hely nélkül): Cambridge University Press. 1983.
↑Milton Abramowitz; Irene Stegun, (szerk.) (1983) [June 1964]. "[Irene Stegun Chapter 26]". Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. Applied Mathematics Series. 55 (Ninth reprint with additional corrections of tenth original printing with corrections (December 1972); first ed.). Washington D.C.; New York: United States Department of Commerce, National Bureau of Standards; Dover Publications. p. 940. ISBN 978-0-486-61272-0. LCCN 64-60036. MR 0167642. LCCN 65-12253.
↑Jonhson, N.L., S. Kotz, , N. Balakrishnan. Continuous Univariate Distributions (Second Ed., Vol. 1, Chapter 18). John Willey and Sons (1994). ISBN 0-471-58495-9
↑Mood, Alexander, Franklin A. Graybill, Duane C. Boes. Introduction to the Theory of Statistics (Third Edition, p. 241-246). McGraw-Hill (1974). ISBN 0-07-042864-6