Varianssi on todennäköisyyslaskennassa ja tilastotieteessä satunnaismuuttujan hajonnan mitta. Varianssi kuvaa sitä, kuinka paljon satunnaismuuttujan arvot keskimäärin vaihtelevat odotusarvosta tai populaation keskiarvosta. Varianssissa yksittäisen mittauksen poikkeamat keskiarvosta tai odotusarvosta korotetaan toiseen potenssiin (neliöön). Varianssi saadaan ottamalla keskiarvo näistä neliöön korotetuista eroista. Kun arvot keskittyvät odotusarvon ympärille tiiviisti, on varianssin arvo pieni, ja kun arvot ovat hajallaan odotusarvon ympärillä, on sen arvo suuri. Reaaliarvoisen satunnaismuuttujan varianssi on sen toinen keskusmomentti. Varianssin yksikkö on satunnaismuuttujan yksikkö korotettuna toiseen potenssiin. Varianssin neliöjuurta sanotaan keskihajonnaksi, jonka yksikkö on sama kuin satunnaismuuttujalla.[1][2][3][4]
Määritelmä ja merkinnät
Matemaattisesti varianssi määritellään reaaliarvoisen satunnaismuuttujan odotusarvon avulla
- [2]
missä on satunnaismuuttujan odotusarvo. Varianssin arvo on ääretön, ellei odotusarvo ole äärellisenä olemassa. Varianssi voidaan merkitä myös
- [2][4]
Varianssin avulla voidaan esittää myös keskihajonta eli standardipoikkeama [2]
Diskreetti satunnaismuuttuja
Diskreetin satunnaismuuttujan varianssi lasketaan
- [2][3][4]
missä on jakauman pistetodennäköisyysfunktio.
Jatkuva satunnaismuuttuja
Jatkuvan satunnaismuuttujaparin varianssi on taas
- [2][3][4]
missä on jakauman tiheysfunktio.
Ominaisuuksia
Rinnakkaiskaavan johtaminen
Varianssin lauseketta voidaan kehittää edelleen käyttämällä hyväksi odotusarvon ominaisuuksia:[2]
Ensimmäistä muotoa kutsutaan toiseksi keskusmomentiksi ja viimeisessä muodossa käytetään toista ja ensimmäistä origomomenttia.[4]
Varianssin laskemiseksi on käytössä myös tekijämomentin sisältävä muoto:
- [3]
Ominaisuuksia
Varianssin arvo on aina epänegatiivinen. Kun varianssi on nolla, ei arvoissa esiinny vaihtelua ja satunnaismuuttuja antaa vain samoja arvoja. Siten
- [3]
Varianssi on kovarianssi kahden identtisen satunnaismuuttujan välillä
- [5] (kovarianssi)
Päättelysääntöjä summista
Jokaisen satunnaismuuttujan arvoon lisätty vakio ei vaikuta varianssin arvoon eli
- [2][3][4]
mutta arvojen kertominen vakiolla kasvattavat tai vähentävät varianssia
- [2][3][4]
Kahden satunnaismuuttujan lineaarikombinaatiossa varianssiin vaikuttaa myös satunnaismuuttujien kovarianssi
- [2]
mikä merkitään yleisemmässä tapauksessa
- [2][4]
Nämä arvot voidaan käsitellä hallitummin kovarianssimatriisissa.[6] Tämä ominaisuus vaikuttaa myös satunnaismuuttujien summan varianssiin
- [4]
Kovarianssia ei tarvitse huomioida, mikäli satunnaismuuttujat ovat korreloimattomia jolloin
Riippumattomat satunnaismuuttujat ovat aina korreloimattomia. Korreloimattomilla satunnaismuuttujilla välimerkki ei vaikuta varianssin arvoon
- [2]
Päättelysääntöjä tuloista
Kahden satunnaismuuttujan tulon varianssi voidaan määrittää odotusarvon ominaisuuksien avulla
Populaatio- ja otosvarianssi
Varianssi lasketaan äärelliselle populaatiolle seuraavasti
- [1][7][4]
missä on populaation keskiarvo. Tätä kutsutaan toisinaan otosvarianssiksi, mutta termin käyttö on vaihtelevaa. Kun on otos laajemmasta populaatiosta, on varianssin tarkentuva mutta harhainen estimaatti. Harhaton estimaatti on
- [1][7][4]
jota yleensä kutsutaan otosvarianssiksi. Suurten otosten tapauksessa ei ole käytännössä merkitystä kumpaa estimaattoria käytetään. Molempien keskihajonta saadaan ottamalla varianssista neliöjuuri.[7][4]
Lähteet
- ↑ a b c Alatupa, Sami et al.: Pitkä Sigma 6, s. 31−42. (lukion pitkän matematiikan oppikirja) Helsinki: Otava, 2010. ISBN 978-951-31-5343-4
- ↑ a b c d e f g h i j k l Mellin, Ilkka: Moniulotteiset satunnaismuuttujat ja jakaumat, s.165−173, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007
- ↑ a b c d e f g Ruskeapää, Heikki: Todennäköisyyslaskenta I (Arkistoitu – Internet Archive)(luentomoniste), Turun Yliopisto, 2012
- ↑ a b c d e f g h i j k l Weisstein, Eric W.: Variance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
- ↑ Weisstein, Eric W.: Covariance (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
- ↑ Weisstein, Eric W.: Covariance Matrix (Math World – A Wolfram Web Resource) Wolfram Research. (englanniksi)
- ↑ a b c Mellin, Ilkka: Lineaarinen regressioanalyysi, s.240−266, luentomoniste kurssista Todennäköisyyslaskenta, Aalto-yliopisto, 2007