Binomiale verdeling
|
Kansfunctie
|
Verdelingsfunctie
|
Parameters
|
aantal pogingen (geheel) kans op succes (reëel)
|
Drager
|
|
Kansfunctie
|
|
Verdelingsfunctie
|
met de onvolledige bètafunctie.
|
Verwachtingswaarde
|
|
Mediaan
|
een uit
|
Modus
|
|
Variantie
|
|
Scheefheid
|
|
Kurtosis
|
|
Moment- genererende functie
|
|
Karakteristieke functie
|
|
|
In de kansrekening en de statistiek is de binomiale verdeling een discrete kansverdeling die de verdeling is van het aantal successen in een reeks van onafhankelijke alternatieven alle met succeskans . Zo'n experiment wordt ook wel een bernoulli-experiment genoemd.
In het geval , komt de binomiale verdeling overeen met de bernoulli-verdeling.
Definitie
In een reeks van bernoulli-experimenten kunnen successen voorkomen. Het aantal successen is een stochastische variabele . Als de kans op succes is, zegt men dat binomiaal verdeeld is met parameters en succeskans , en noteert:
- ,
of ook
De kans op precies successen kan gemakkelijk berekend worden door te bedenken dat elke reeks uitkomsten met successen en mislukkingen dezelfde kans heeft. Omdat er (zie binomiaalcoëfficiënt) verschillende reeksen zijn met precies successen, wordt de kansfunctie voor gegeven door:
Voorbeeld
We gooien 4 keer met een (eerlijke) dobbelsteen. We kunnen 0, 1, 2, 3 of 4 keer een 6 gooien. Het aantal keren dat we 6 gooien, , is -verdeeld. Hoe groot is de kans dat we van de 4 worpen 1 keer een 6 gooien? Hier is en , dus:
Momenten
De verwachtingswaarde en de variantie van een -verdeelde stochastische variabele laten zich het eenvoudigst bepalen door te schrijven als de som van onafhankelijke, -verdeelde variabelen: . Dan volgt:
en
- .
De bovenstaande relaties kunnen ook afgeleid worden met behulp van berekeningen soortgelijk aan de volgende:
-
- .
Uit deze betrekking kan het derde moment bepaald worden, en daarmee de scheefheid van de verdeling.
Ook volgt daaruit direct:
en
- .
Uit deze laatste relatie volgt weer:
- ,
zodat
- .
Benadering
Het is nogal bewerkelijk of bijna ondoenlijk om voor grote waarden van het aantal experimenten de exacte kansen te berekenen. Dit is ook niet nodig omdat de binomiale verdeling voor grote benaderd kan worden door een normale verdeling of door een Poissonverdeling.
Als vuistregel neemt men wel dat de -verdeling voor goed benaderd kan worden door een geschikte normale verdeling, mits de succeskans niet te klein of te groot is. Als vuistregel geldt: en . Voor kleinere en grotere waarden van is de binomiale verdeling te scheef om door de symmetrische normale verdeling goed benaderd te worden. Een benadering door een geschikte Poissonverdeling is dan mogelijk.
Normale benadering
De stochastische variabele is -verdeeld. Voor toenemende nadert de verdeling van naar een normale verdeling, dus met verwachtingswaarde en variantie . Er geldt dus:
- .
Daarin is -verdeeld en standaardnormaal verdeeld.
Omdat de binomiale verdeling een discrete verdeling is, geldt
- ,
hetgeen leidt tot twee (en meer) mogelijke benaderingen, die voor niet al te grote waarden van nogal verschillen. Om dit probleem te ondervangen past men wel de zogenaamde continuïteitscorrectie toe, en neemt als betere benadering een waarde tussen de genoemde uitersten, en wel:
- .
Voorbeeld
Hoe groot is de kans om in 25 worpen met een zuivere munt ten hoogste 10 keer kruis te gooien? Noem het aantal keren kruis; is dus -verdeeld is. De gevraagde kans is:
- .
Omdat en , kan deze kans benaderd worden met behulp van een -verdeling.
- .
Men kan ook berekenen:
- .
Dat zijn twee benaderingen die nogal uiteenlopen, maar waar de werkelijke waarde wel tussen ligt. Met de continuïteitscorrectie wordt de benadering:
- .
Poissonbenadering
Omdat de -verdeling voor toenemende en constante waarde van nadert naar de Poissonverdeling met parameter , kan de -verdeling voor grote waarden van en waarden van in de buurt van 0 benaderd worden door een geschikte Poissonverdeling. In dat geval geldt dus: :
- .
Daarin is Poissonverdeeld met parameter .
Ook voor waarden van in de buurt van 1 kan deze benadering gebruikt worden, zij het dat men niet de verdeling van benadert, maar de verdeling van , die -verdeeld is, dus met een kleine waarde van .
Voorbeeld
Hoe groot is de kans om in 25 worpen met een zuivere dobbelsteen ten hoogste 2 keer 6 te gooien? Noem het aantal keren 6. Dus is -verdeeld. De gevraagde kans is:
- .
Omdat kan we deze kans benaderd worden met behulp van een Poissonverdeling met parameter 25/6.
- .
Hoe groot is de kans om in 25 worpen met een zuivere dobbelsteen minstens 20 keer geen 6 te gooien? Noem het aantal keren dat geen 6 gegooid wordt. is dus -verdeeld. De gevraagde kans is:
- .
Nu is tamelijk groot, maar de vraag kan ook geformuleerd worden als de kans op ten hoogste 5 keer 6.
- .
En is weer -verdeeld, dus:
- .
Zie ook