Schatten

Een categorie van methoden die de statistiek hanteert om informatie te verkrijgen, wordt gevormd door de schattingsmethoden. Een onbekende parameter van een populatie (of verdeling) wordt geschat door een uit de steekproef berekende grootheid, de schatting. Het voorschrift dat bepaalt hoe de schatting uit de steekproef moet worden berekend, wordt schatter genoemd.

Algemeen bekend is het (steekproef-)gemiddelde als schatting voor het populatiegemiddelde (of de verwachtingswaarde).

Schattingsmethoden

Bekende schattingsmethoden zijn:

Voorbeelden

Een vreemde munt ziet er niet bepaald symmetrisch uit, zodat de kans op kruis vermoedelijk niet zal zijn. Daarom gooien we 10 keer met de munt. Stel dat we in deze steekproef 3 keer kruis vinden. We zouden dan de onbekende parameter (de populatiefractie) kunnen schatten door de steekproeffractie .

Een ander voorbeeld is bekend uit de Tweede Wereldoorlog. Het viel de Engelsen op dat Duits oorlogsmaterieel, zoals neergehaalde Duitse bommenwerpers, banden van voertuigen en versnellingsbakken van tanks, "gründlich" voorzien was van een serienummer. Op grond van de gevonden serienummers in de "steekproef" gaven statistici een schatting van de totale (maandelijkse) productie . Het zal duidelijk zijn dat alleen het hoogste gevonden nummer van belang is, d.w.z. een goede schatter zal alleen afhankelijk zijn van . Men kan laten zien dat bij een steekproefomvang , een goede schatting van gegeven wordt door:

Omdat

en dus

,

is een zuivere schatter van .

Overigens gebruikten de statistici een iets andere schatter, die voor grote steekproeven praktisch gelijk is aan . Na de oorlog bleek dat de schattingen tamelijk nauwkeurig waren, in tegenstelling tot de ramingen van de geheime dienst, die factoren 5 à 7 te hoog waren.

Schatter

Het schatten van een parameter van een populatie of kansverdeling gebeurt door middel van een schatter, dat is een steekproeffunctie: een functie die uit de steekproef een getal, de schatting, berekent. Hoewel iedere steekproeffunctie aangemerkt kan worden als schatter, is het zaak goede schatters te vinden. Een goede schatter zal schattingen vinden die in bepaalde zin niet veel afwijken van de onbekende waarde van de parameter. Een bijzondere groep van 'goede' schatters zijn de zuivere schatters. Zuivere schatter zijn schatters die gemiddeld, over alle mogelijke steekproeven, precies de waarde van de te schatten parameter opleveren. Preciezer gezegd: een schatter is zuiver wanneer de verwachtingswaarde van de schatter gelijk is aan de te schatten parameter. De 'uniform beste zuivere schatter' is daarbij de schatter die voor alle mogelijke parameterwaarden de kleinste variantie heeft van alle zuivere schatters.

Voorbeelden

Laat een aselecte steekproef zijn uit een populatie of kansverdeling.

Binomiale verdeling: . De te schatten parameter is de succeskans (populatiefractie) . Laat het aantal successen in de steekproef zijn, dan kan geschat worden door o.a. de schatters: (de steekproeffractie), en .
Uniforme verdeling op het interval . De te schatten parameter is de bovengrens . Geschikte schatters zijn: (de bovengrens in de steekproef) en .
Willekeurige populatie (of verdeling) met populatiegemiddelde en populatievariantie . Goede schatters zijn de overeenkomstige grootheden in de steekproef. Het steekproefgemiddelde als schatter voor , en de steekproefvariantie voor .