Standaardafwijking

Grafiek van een normale verdeling; iedere band heeft breedte van 1 standaardafwijking.

De standaardafwijking of standaarddeviatie (vaak aangeduid met de Griekse letter σ voor de populatie en s voor de steekproef), een begrip in de statistiek, is een maat voor de spreiding van een variabele of van een verdeling of populatie. De standaardafwijking is gedefinieerd als de wortel uit de variantie, en daardoor vergelijkbaar met de waarden van de variabele zelf.

De standaardafwijking wordt gebruikt om de spreiding – de mate waarin de waarden onderling verschillen – van een verdeling aan te geven. De standaardafwijking wordt, anders dan de variantie, in dezelfde eenheid uitgedrukt als de verwachtingswaarde of het gemiddelde.

Ook voor een steekproef uit een populatie of verdeling spreekt men van standaardafwijking, of beter van steekproefstandaardafwijking, meestal aangeduid met de letter s. Deze grootheid is een schatting van de standaardafwijking in de bijbehorende populatie of verdeling. Voor een steekproef is de variantie (ongeveer) het gemiddelde van de kwadraten van de afwijking van de metingen ten opzichte van het gemiddelde van de gegevens.

Definities

Continue kansverdeling

Voor een continue kansverdeling met kansdichtheid is de standaardafwijking gedefinieerd als de wortel uit de variantie, mits deze bestaat:

Daarin is de verwachtingswaarde, gedefinieerd door:

,

eveneens mits deze bestaat.

Discrete kansverdeling

Voor een discrete kansverdeling met kansfunctie is de standaardafwijking analoog gedefinieerd als de wortel uit de variantie, mits deze bestaat:

Daarin is weer de verwachtingswaarde, gedefinieerd door:

,

eveneens mits deze bestaat.

Toevalsvariabele

Voor een toevalsvariabele met kansdichtheid of kansfunctie gelden dezelfde definities met respectievelijk of . De standaardafwijking wordt dan wel aangegeven met . De beide formules laten zich samenvatten in:

,

waarin de verwachtingswaarde is van ; alles onder de voorwaarde dat de verwachtingswaarden bestaan.

De laatste formule is ook geldig voor een willekeurige toevalsvariabele.

Steekproef

Ook voor een steekproef met uitkomsten is de (steekproef)standaardafwijking gedefinieerd, meestal aangeduid met , als de wortel uit de (steekproef)variantie:

Daarin is het steekproefgemiddelde.

En kan hiermee verder uitgewerkt worden tot een praktischere variant van de (steekproef)variantie-definitie:

Enigszins verwarrend wordt ook de iets afwijkende grootheid

aangeduid als steekproefvariantie.

Normale verdeling

Bij normale verdelingen wijkt van de mogelijke waarden:

  • 68,27% ten hoogste 1 keer de standaardafwijking af van de verwachtingswaarde (het midden van de verdeling)
  • 95,45% ten hoogste 2 keer de standaardafwijking af van de verwachtingswaarde
  • 99,73% ten hoogste 3 keer de standaardafwijking af van de verwachtingswaarde
  • 99,9937% ten hoogste 4 keer de standaardafwijking af van de verwachtingswaarde
  • 99,999943% ten hoogste 5 keer de standaardafwijking af van de verwachtingswaarde
  • 99,9999998% ten hoogste 6 keer de standaardafwijking af van de verwachtingswaarde

Willekeurige verdeling

Dankzij de centrale limietstelling weten we verder dat voor veel verdelingen de verdeling van de som en dus ook van het gemiddelde van een groot aantal onafhankelijke waarnemingen daaruit, bij voldoende veel metingen bij benadering de vorm van een normale verdeling heeft. Bijgevolg gelden de bovengenoemde percentages niet alleen voor de normale verdeling, maar bij benadering ook voor het gemiddelde van een groot aantal onafhankelijke waarnemingen uit veel onbekende verdelingen.

Zie ook