Binomna raspodela
Binomna raspodela Funkcija verovatnoće
Funkcija kumulativne raspodele
Notacija
B
(
n
,
p
)
{\displaystyle B(n,p)}
Parametri
n
∈ ∈ -->
{
0
,
1
,
2
,
… … -->
}
{\displaystyle n\in \{0,1,2,\ldots \}}
– broj pokušaja
p
∈ ∈ -->
[
0
,
1
]
{\displaystyle p\in [0,1]}
– verovatnoća uspeha za svaki pokušajNositelj
k
∈ ∈ -->
{
0
,
1
,
… … -->
,
n
}
{\displaystyle k\in \{0,1,\ldots ,n\}}
– broj uspehapmf
(
n
k
)
p
k
(
1
− − -->
p
)
n
− − -->
k
{\displaystyle {\binom {n}{k}}p^{k}(1-p)^{n-k}}
CDF
I
1
− − -->
p
(
n
− − -->
k
,
1
+
k
)
{\displaystyle I_{1-p}(n-k,1+k)}
Prosek
n
p
{\displaystyle np}
Medijana
⌊ ⌊ -->
n
p
⌋ ⌋ -->
{\displaystyle \lfloor np\rfloor }
ili
⌈ ⌈ -->
n
p
⌉ ⌉ -->
{\displaystyle \lceil np\rceil }
Modus
⌊ ⌊ -->
(
n
+
1
)
p
⌋ ⌋ -->
{\displaystyle \lfloor (n+1)p\rfloor }
ili
⌈ ⌈ -->
(
n
+
1
)
p
⌉ ⌉ -->
− − -->
1
{\displaystyle \lceil (n+1)p\rceil -1}
Varijansa
n
p
(
1
− − -->
p
)
{\displaystyle np(1-p)}
Koef. asimetrije
1
− − -->
2
p
n
p
(
1
− − -->
p
)
{\displaystyle {\frac {1-2p}{\sqrt {np(1-p)}}}}
Kurtoza
1
− − -->
6
p
(
1
− − -->
p
)
n
p
(
1
− − -->
p
)
{\displaystyle {\frac {1-6p(1-p)}{np(1-p)}}}
Entropija
1
2
log
2
-->
(
2
π π -->
e
n
p
(
1
− − -->
p
)
)
+
O
(
1
n
)
{\displaystyle {\frac {1}{2}}\log _{2}\left(2\pi enp(1-p)\right)+O\left({\frac {1}{n}}\right)}
u šanonima .MGF
(
1
− − -->
p
+
p
e
t
)
n
{\displaystyle (1-p+pe^{t})^{n}}
CF
(
1
− − -->
p
+
p
e
i
t
)
n
{\displaystyle (1-p+pe^{it})^{n}}
PGF
G
(
z
)
=
[
(
1
− − -->
p
)
+
p
z
]
n
{\displaystyle G(z)=[(1-p)+pz]^{n}}
Fišerova informacija
g
n
(
p
)
=
n
p
(
1
− − -->
p
)
{\displaystyle g_{n}(p)={\frac {n}{p(1-p)}}}
(za fiksno
n
{\displaystyle n}
)
Binomna distribucija za
p
=
0
,
5
{\displaystyle p=0,5}
sa n i k kao u Paskalovom trouglu Verovatnoća da će kugla u Galtonovoj kutiji sa 8 slojeva (n = 8) završiti u centralnoj kutiji (k = 4) je
70
/
256
{\displaystyle 70/256}
.
U teoriji verovatnoće i statistici , binomna raspodela sa parametrima n i p je diskretna raspodela verovatnoće broja uspeha u sekvenci od n nezavisnih eksperimenata , svaki od kojih daje odgovor na da-ne pitanje , i svaki ima svoj bulov rezultat - uspeh/da /tačno /jedan (sa verovatnoćom ́ p ) ili neuspeh/ne/lažno/nula (sa verovatnoćom q = 1 − p ). Pojedinačni uspeh/neuspeh eksperimenta se takođe naziva Bernulijev pokušaj ili Bernulijev eksperiment, a sekvenca ishoda se naziva Bernulijev proces ; za pojedinačni pokušaj, i.e., n = 1, binomna distribucija je Bernulijeva raspodela . Binomna distribucija je osnova za popularni binomni test statističkog značaja .
Binomna distribucija se često koristi za modelovanje broja uspeha u uzorku veličine n koji je izvučen sa zamenom iz populacije veličine N . Ako se uzorkovanje vrši bez zamene, izvlačenja nisu nezavisna, pa je rezultirajuća raspodela hipergeometrijska , a ne binomna. Međutim, za N mnogo veće od n , binomna distribucija ostaje dobra aproksimacija i široko se koristi.
Specifikacija
Funkcija verovatnoće
Generalno, ako randomna promenljiva X sledi binomnu distribuciju sa parametrima n ∈ ℕ i p ∈ [0,1], piše se X ~ B(n , p ). Verovatnoća da se dobije tačno k uspeha u n pokušaja je data funkcijom verovatnoće :
f
(
k
,
n
,
p
)
=
Pr
(
k
;
n
,
p
)
=
Pr
(
X
=
k
)
=
(
n
k
)
p
k
(
1
− − -->
p
)
n
− − -->
k
{\displaystyle f(k,n,p)=\Pr(k;n,p)=\Pr(X=k)={\binom {n}{k}}p^{k}(1-p)^{n-k}}
za k = 0, 1, 2, ..., n , gde je
(
n
k
)
=
n
!
k
!
(
n
− − -->
k
)
!
{\displaystyle {\binom {n}{k}}={\frac {n!}{k!(n-k)!}}}
binomni koeficijent ,[ 1] po kome je raspodela dobila ime. Formula se može razumeti na sledeći način. k uspeha se javlja sa verovatnoćom p k i n − k neuspeha se javlja sa verovatnoćom (1 − p )n − k . Međutim, k uspeha se može javiti bilo gde među n pokušaja, i postoji
(
n
k
)
{\displaystyle {\binom {n}{k}}}
različitih načina raspodeljivanja k uspeha u nizu od n pokušaja.
Pri stvaranju referentnih tabela za verovatnoću binomne distribucije, obično se tabela popunjava do n /2 vrednosti. To je zato što se za k > n /2, verovatnoća može izračunati njenim komplementom kao
f
(
k
,
n
,
p
)
=
f
(
n
− − -->
k
,
n
,
1
− − -->
p
)
.
{\displaystyle f(k,n,p)=f(n-k,n,1-p).}
Gledajući izraz f (k , n , p ) kao funkciju od k , postoji k vrednosti koje je maksimiziraju. Stoga se k vrednost može naći izračunavajući
f
(
k
+
1
,
n
,
p
)
f
(
k
,
n
,
p
)
=
(
n
− − -->
k
)
p
(
k
+
1
)
(
1
− − -->
p
)
{\displaystyle {\frac {f(k+1,n,p)}{f(k,n,p)}}={\frac {(n-k)p}{(k+1)(1-p)}}}
i upoređujući tu vrednost sa 1. Uvek postoji ceo broj M koji zadovoljava
(
n
+
1
)
p
− − -->
1
≤ ≤ -->
M
<
(
n
+
1
)
p
.
{\displaystyle (n+1)p-1\leq M<(n+1)p.}
f (k , n , p ) je monotono rastući za k < M i monotono opadajući za k > M , uz izuzetak slučaja gde je (n + 1)p ceo broj. U tom slučaju, postoje dve vrednosti za koje je f maksimalno: (n + 1)p i (n + 1)p − 1. M je najverovatniji ishod (mada još uvek može da bude sveukupno malo verovatan) Bernulijevih pokušaja i naziva se modus .[ 2] [ 3] [ 4] [ 5]
Funkcija kumulativne verovatnoće
Funkcija kumulativne verovatnoće se može izraziti kao:[ 6]
F
(
k
;
n
,
p
)
=
Pr
(
X
≤ ≤ -->
k
)
=
∑ ∑ -->
i
=
0
⌊ ⌊ -->
k
⌋ ⌋ -->
(
n
i
)
p
i
(
1
− − -->
p
)
n
− − -->
i
{\displaystyle F(k;n,p)=\Pr(X\leq k)=\sum _{i=0}^{\lfloor k\rfloor }{n \choose i}p^{i}(1-p)^{n-i}}
gde je
⌊ ⌊ -->
k
⌋ ⌋ -->
{\displaystyle \lfloor k\rfloor \,}
„pod” ispod k , i.e. najveći ceo broj manji od ili jedna sa k .
On se može predstaviti u vidu regulisane nekompletne beta funkcije ,[ 7] [ 8] na sledeći način:[ 9]
F
(
k
;
n
,
p
)
=
Pr
(
X
≤ ≤ -->
k
)
=
I
1
− − -->
p
(
n
− − -->
k
,
k
+
1
)
=
(
n
− − -->
k
)
(
n
k
)
∫ ∫ -->
0
1
− − -->
p
t
n
− − -->
k
− − -->
1
(
1
− − -->
t
)
k
d
t
.
{\displaystyle {\begin{aligned}F(k;n,p)&=\Pr(X\leq k)\\&=I_{1-p}(n-k,k+1)\\&=(n-k){n \choose k}\int _{0}^{1-p}t^{n-k-1}(1-t)^{k}\,dt.\end{aligned}}}
Neki granični slučajevi zatvorenog oblika za funkciju kumulativne distribucije dati su u nastavku.
Primer
Pretpostavka je da se pristranim bacanjem novčića dobija glava sa verovatnoćom 0,3. Pitanje je: koja je verovatnoća postizanja 0, 1, ..., 6 glava posle šest bacanja?
Pr
(
0
heads
)
=
f
(
0
)
=
Pr
(
X
=
0
)
=
(
6
0
)
0.3
0
(
1
− − -->
0.3
)
6
− − -->
0
=
0.117649
{\displaystyle \Pr(0{\text{ heads}})=f(0)=\Pr(X=0)={6 \choose 0}0.3^{0}(1-0.3)^{6-0}=0.117649}
Pr
(
1
heads
)
=
f
(
1
)
=
Pr
(
X
=
1
)
=
(
6
1
)
0.3
1
(
1
− − -->
0.3
)
6
− − -->
1
=
0.302526
{\displaystyle \Pr(1{\text{ heads}})=f(1)=\Pr(X=1)={6 \choose 1}0.3^{1}(1-0.3)^{6-1}=0.302526}
Pr
(
2
heads
)
=
f
(
2
)
=
Pr
(
X
=
2
)
=
(
6
2
)
0.3
2
(
1
− − -->
0.3
)
6
− − -->
2
=
0.324135
{\displaystyle \Pr(2{\text{ heads}})=f(2)=\Pr(X=2)={6 \choose 2}0.3^{2}(1-0.3)^{6-2}=0.324135}
Pr
(
3
heads
)
=
f
(
3
)
=
Pr
(
X
=
3
)
=
(
6
3
)
0.3
3
(
1
− − -->
0.3
)
6
− − -->
3
=
0.18522
{\displaystyle \Pr(3{\text{ heads}})=f(3)=\Pr(X=3)={6 \choose 3}0.3^{3}(1-0.3)^{6-3}=0.18522}
Pr
(
4
heads
)
=
f
(
4
)
=
Pr
(
X
=
4
)
=
(
6
4
)
0.3
4
(
1
− − -->
0.3
)
6
− − -->
4
=
0.059535
{\displaystyle \Pr(4{\text{ heads}})=f(4)=\Pr(X=4)={6 \choose 4}0.3^{4}(1-0.3)^{6-4}=0.059535}
Pr
(
5
heads
)
=
f
(
5
)
=
Pr
(
X
=
5
)
=
(
6
5
)
0.3
5
(
1
− − -->
0.3
)
6
− − -->
5
=
0.010206
{\displaystyle \Pr(5{\text{ heads}})=f(5)=\Pr(X=5)={6 \choose 5}0.3^{5}(1-0.3)^{6-5}=0.010206}
Pr
(
6
heads
)
=
f
(
6
)
=
Pr
(
X
=
6
)
=
(
6
6
)
0.3
6
(
1
− − -->
0.3
)
6
− − -->
6
=
0.000729
{\displaystyle \Pr(6{\text{ heads}})=f(6)=\Pr(X=6)={6 \choose 6}0.3^{6}(1-0.3)^{6-6}=0.000729}
[ 10]
Očekivanje
Ako je X ~ B (n , p ), drugim rečima, X je binomno distribuirana randomna promenljiva, pri čemu je n ukupan broj eksperimenata, a p je verovatnoća svakog eksperimenta da proizvede uspešan rezultat, onda je očekivana vrednost X :[ 11]
E
-->
[
X
]
=
n
p
.
{\displaystyle \operatorname {E} [X]=np.}
Na primer, ako je n = 100, i p = 1/4, onda je prosečan broj uspešnih rezultata 25.
Proof: Srednja vrednost, μ , se direktno izračunava po definiciji
μ μ -->
=
∑ ∑ -->
i
=
0
n
x
i
p
i
,
{\displaystyle \mu =\sum _{i=0}^{n}x_{i}p_{i},}
i binomnoj teoremi :
μ μ -->
=
∑ ∑ -->
k
=
0
n
k
(
n
k
)
p
k
(
1
− − -->
p
)
n
− − -->
k
=
n
p
∑ ∑ -->
k
=
0
n
k
(
n
− − -->
1
)
!
(
n
− − -->
k
)
!
k
!
p
k
− − -->
1
(
1
− − -->
p
)
(
n
− − -->
1
)
− − -->
(
k
− − -->
1
)
=
n
p
∑ ∑ -->
k
=
1
n
(
n
− − -->
1
)
!
(
(
n
− − -->
1
)
− − -->
(
k
− − -->
1
)
)
!
(
k
− − -->
1
)
!
p
k
− − -->
1
(
1
− − -->
p
)
(
n
− − -->
1
)
− − -->
(
k
− − -->
1
)
=
n
p
∑ ∑ -->
k
=
1
n
(
n
− − -->
1
k
− − -->
1
)
p
k
− − -->
1
(
1
− − -->
p
)
(
n
− − -->
1
)
− − -->
(
k
− − -->
1
)
=
n
p
∑ ∑ -->
ℓ ℓ -->
=
0
n
− − -->
1
(
n
− − -->
1
ℓ ℓ -->
)
p
ℓ ℓ -->
(
1
− − -->
p
)
(
n
− − -->
1
)
− − -->
ℓ ℓ -->
sa
ℓ ℓ -->
:=
k
− − -->
1
=
n
p
∑ ∑ -->
ℓ ℓ -->
=
0
m
(
m
ℓ ℓ -->
)
p
ℓ ℓ -->
(
1
− − -->
p
)
m
− − -->
ℓ ℓ -->
sa
m
:=
n
− − -->
1
=
n
p
(
p
+
(
1
− − -->
p
)
)
m
=
n
p
{\displaystyle {\begin{aligned}\mu &=\sum _{k=0}^{n}k{\binom {n}{k}}p^{k}(1-p)^{n-k}\\&=np\sum _{k=0}^{n}k{\frac {(n-1)!}{(n-k)!k!}}p^{k-1}(1-p)^{(n-1)-(k-1)}\\&=np\sum _{k=1}^{n}{\frac {(n-1)!}{((n-1)-(k-1))!(k-1)!}}p^{k-1}(1-p)^{(n-1)-(k-1)}\\&=np\sum _{k=1}^{n}{\binom {n-1}{k-1}}p^{k-1}(1-p)^{(n-1)-(k-1)}\\&=np\sum _{\ell =0}^{n-1}{\binom {n-1}{\ell }}p^{\ell }(1-p)^{(n-1)-\ell }&&{\text{sa }}\ell :=k-1\\&=np\sum _{\ell =0}^{m}{\binom {m}{\ell }}p^{\ell }(1-p)^{m-\ell }&&{\text{sa }}m:=n-1\\&=np(p+(1-p))^{m}\\&=np\end{aligned}}}
Srednja vrednost se može izvesti iz jednačine
X
=
X
1
+
⋯ ⋯ -->
+
X
n
{\displaystyle X=X_{1}+\cdots +X_{n}}
gde su sve randomne promenljive
X
i
{\displaystyle X_{i}}
obuhvaćene Bernulijevom raspodelom sa
E
[
X
i
]
=
p
{\displaystyle E[X_{i}]=p}
(
X
i
=
1
{\displaystyle X_{i}=1}
ako i -ti eksperiment uspe, dok je inače
X
i
=
0
{\displaystyle X_{i}=0}
). Dobija se:
E
[
X
]
=
E
[
X
1
+
⋯ ⋯ -->
+
X
n
]
=
E
[
X
1
]
+
⋯ ⋯ -->
+
E
[
X
n
]
=
p
+
⋯ ⋯ -->
+
p
⏟ ⏟ -->
n
puta
=
n
p
{\displaystyle E[X]=E[X_{1}+\cdots +X_{n}]=E[X_{1}]+\cdots +E[X_{n}]=\underbrace {p+\cdots +p} _{n{\text{ puta}}}=np}
Varijansa
Varijansa je:
Var
-->
(
X
)
=
n
p
(
1
− − -->
p
)
.
{\displaystyle \operatorname {Var} (X)=np(1-p).}
Dokaz: Neka je
X
=
X
1
+
⋯ ⋯ -->
+
X
n
{\displaystyle X=X_{1}+\cdots +X_{n}}
gde su sve
X
i
{\displaystyle X_{i}}
nezavisne randomne promenljive Bernulijeve raspodele. Kako je
Var
-->
(
X
i
)
=
p
(
1
− − -->
p
)
{\displaystyle \operatorname {Var} (X_{i})=p(1-p)}
, dobija se:
Var
-->
(
X
)
=
Var
-->
(
X
1
+
⋯ ⋯ -->
+
X
n
)
=
Var
-->
(
X
1
)
+
⋯ ⋯ -->
+
Var
-->
(
X
n
)
=
n
Var
-->
(
X
1
)
=
n
p
(
1
− − -->
p
)
.
{\displaystyle \operatorname {Var} (X)=\operatorname {Var} (X_{1}+\cdots +X_{n})=\operatorname {Var} (X_{1})+\cdots +\operatorname {Var} (X_{n})=n\operatorname {Var} (X_{1})=np(1-p).}
Reference
^ Lilavati Section 6, Chapter 4 (see Knuth (1997) ).
^ „AP Statistics Review - Density Curves and the Normal Distributions” . Архивирано из оригинала 02. 04. 2015. г. Приступљено 16. 3. 2015 .
^ „Relationship between the mean, median, mode, and standard deviation in a unimodal distribution” .
^ Hippel, Paul T. von (2005). „Mean, Median, and Skew: Correcting a Textbook Rule” . Journal of Statistics Education . 13 (2). doi :10.1080/10691898.2005.11910556 . Архивирано из оригинала 14. 10. 2008. г. Приступљено 15. 08. 2019 .
^ Bottomley, H. (2004). „Maximum distance between the mode and the mean of a unimodal distribution” (PDF) . Unpublished preprint .
^ Park, Kun Il (2018). Fundamentals of Probability and Stochastic Processes with Applications to Communications . Springer. ISBN 978-3-319-68074-3 .
^ Zelen, M.; Severo, N. C. (1972), „26. Probability functions”, Ур.: Abramowitz, Milton ; Stegun, Irene A. , Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables , New York: Dover Publications , стр. 925—995, ISBN 978-0-486-61272-0
^ Davis, Philip J. (1972), „6. Gamma function and related functions”, Ур.: Abramowitz, Milton ; Stegun, Irene A. , Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables , New York: Dover Publications , ISBN 978-0-486-61272-0
^ Wadsworth, G. P. (1960). Introduction to Probability and Random Variables . New York: McGraw-Hill. стр. 52.
^ Hamilton Institute. "The Binomial Distribution" October 20, 2010.
^ See Proof Wiki
Literatura
Hirsch, Werner Z. (1957). „Binomial Distribution—Success or Failure, How Likely Are They?” . Introduction to Modern Statistics . New York: MacMillan. стр. 140—153.
Neter, John; Wasserman, William; Whitmore, G. A. (1988). Applied Statistics (Third изд.). Boston: Allyn & Bacon. стр. 185 –192. ISBN 0-205-10328-6 .
Ash, Robert B. (1990) [1965]. Information Theory . Dover Publications, Inc. ISBN 0-486-66521-6 .
Benjamin, Arthur T. ; Quinn, Jennifer J. (2003). Proofs that Really Count: The Art of Combinatorial Proof . Dolciani Mathematical Expositions. 27 . Mathematical Association of America . ISBN 978-0-88385-333-7 .
Bryant, Victor (1993). Aspects of combinatorics . Cambridge University Press. ISBN 0-521-41974-3 .
Flum, Jörg; Grohe, Martin (2006). Parameterized Complexity Theory . Springer. ISBN 978-3-540-29952-3 . Архивирано из оригинала 18. 11. 2007. г. Приступљено 15. 08. 2019 .
Fowler, David (januar 1996). „The Binomial Coefficient Function” . The American Mathematical Monthly . Mathematical Association of America. 103 (1): 1—17. JSTOR 2975209 . doi :10.2307/2975209 .
Goetgheluck, P. (1987). „Computing Binomial Coefficients” . American Mathematical Monthly . 94 : 360—365. doi :10.2307/2323099 .
Graham, Ronald L. ; Knuth, Donald E. ; Patashnik, Oren (1994). Concrete Mathematics (Second изд.). Addison-Wesley. стр. 153 –256. ISBN 0-201-55802-5 .
Gradshteyn, I. S.; Ryzhik, I. M. (2014). Table of Integrals, Series, and Products (8th изд.). Academic Press. ISBN 978-0-12-384933-5 .
Grinshpan, A. Z. (2010), „Weighted inequalities and negative binomials”, Advances in Applied Mathematics , 45 (4): 564—606, doi :10.1016/j.aam.2010.04.004
Higham, Nicholas J. (1998). Handbook of writing for the mathematical sciences . SIAM . стр. 25 . ISBN 0-89871-420-6 .
Knuth, Donald E. (1997). The Art of Computer Programming, Volume 1: Fundamental Algorithms (Third изд.). Addison-Wesley. стр. 52—74. ISBN 0-201-89683-4 .
Singmaster, David (1974). „Notes on binomial coefficients. III. Any integer divides almost all binomial coefficients”. Journal of the London Mathematical Society . 8 (3): 555—560. doi :10.1112/jlms/s2-8.3.555 .
Shilov, G. E. (1977). Linear algebra . Dover Publications. ISBN 978-0-486-63518-7 .
Spoljašnje veze