ポアソン二項分布 (ポアソンにこうぶんぷ、英 : Poisson binomial distribution )とは、統計学 および確率論 における独立 なベルヌーイ試行 の和として定義される離散確率分布 である。
別の言い方をすれば、これは成功確率がそれぞれ p 1 , p 2
, …, pn でありそれぞれ独立な n 回の試行を行ったときの成功回数の離散確率分布 である。
特に、成功確率が全て等しい (p 1 = p 2 = … = pn ) ときは、ポアソン二項分布は普通の二項分布 になる。すなわち二項分布はポアソン二項分布の特別な場合である。
確率質量関数
n 個の確率変数 Xi (i ∈ {1, 2, …, n } ) は、それぞれ独立で成功確率がそれぞれ p 1 , p 2 , …, pn であるベルヌーイ試行 とする。すなわち、
X
i
∈ ∈ -->
{
1
,
0
}
,
P
(
X
i
=
1
)
=
p
i
,
Pr
(
X
i
=
0
)
=
1
− − -->
p
i
{\displaystyle X_{i}\in \{1,0\},\qquad P(X_{i}=1)=p_{i},\qquad \Pr(X_{i}=0)=1-p_{i}}
とする。確率変数
X
=
∑ ∑ -->
i
=
1
n
X
i
{\displaystyle X=\sum _{i=1}^{n}X_{i}}
は、このような n 回の試行のうちで成功した回数を表す確率変数である。k 回成功する確率は次のような和で表現される[ 1] 。
Pr
(
X
=
k
)
=
∑ ∑ -->
A
∈ ∈ -->
F
k
∏ ∏ -->
i
∈ ∈ -->
A
p
i
∏ ∏ -->
j
∈ ∈ -->
A
c
(
1
− − -->
p
j
)
{\displaystyle \Pr(X=k)=\sum _{A\in F_{k}}\prod _{i\in A}p_{i}\prod _{j\in A^{c}}(1-p_{j})}
ただし、Fk は {1, 2, …, n } から選べる全ての k 要素部分集合の族である。例えば n = 3 なら、F 2 = {{1, 2}, {1, 3}, {2, 3}} である。また Ac は A の補集合。すなわち
A
c
=
{
1
,
2
,
3
,
… … -->
,
n
}
∖ ∖ -->
A
{\displaystyle A^{c}=\{1,2,3,\dots ,n\}\backslash A}
である。
これが、定義から直接導かれるポアソン二項分布の確率質量関数である。Fk は
n
!
(
n
− − -->
k
)
!
k
!
{\displaystyle {\frac {n!}{(n-k)!k!}}}
要素を含み、この数は n とともに急速に増大するため、試行回数 n が小さい場合以外は実際にこの和を計算することは困難である。(例えば n = 30 のとき F 15 は 1020 もの要素を含む)。
幸いにも、
Pr
(
X
=
k
)
{\displaystyle \Pr(X=k)}
を計算する非常に効果的な方法がある。1回も成功しない確率が分かれば、n 回成功の確率は次のようにして再帰的に計算できる[ 2] 。
Pr
(
X
=
k
)
=
{
∏ ∏ -->
i
=
1
n
(
1
− − -->
p
i
)
,
k
=
0
1
k
∑ ∑ -->
i
=
1
k
(
− − -->
1
)
i
− − -->
1
Pr
(
X
=
k
− − -->
i
)
T
(
i
)
,
k
>
0
{\displaystyle \Pr(X=k)=\left\{{\begin{aligned}&\prod _{i=1}^{n}(1-p_{i}),\qquad k=0\\&{\frac {1}{k}}\sum _{i=1}^{k}(-1)^{i-1}\Pr(X=k-i)T(i),\qquad k>0\\\end{aligned}}\right.}
ただし、
T
(
i
)
=
∑ ∑ -->
j
=
1
n
(
p
j
1
− − -->
p
j
)
i
{\displaystyle T(i)=\sum _{j=1}^{n}\left({\frac {p_{j}}{1-p_{j}}}\right)^{i}}
。
他にも離散フーリエ変換 を使う次のような計算も可能である[ 3] 。
Pr
(
X
=
k
)
=
1
n
+
1
∑ ∑ -->
l
=
0
n
C
l
k
∏ ∏ -->
m
=
1
n
(
1
+
(
C
l
− − -->
1
)
p
m
)
{\displaystyle \Pr(X=k)={\frac {1}{n+1}}\sum _{l=0}^{n}C^{lk}\prod _{m=1}^{n}\left(1+(C^{l}-1){p_{m}}\right)}
ただし、
C
=
exp
-->
(
− − -->
2
i
π π -->
n
+
1
)
{\displaystyle C=\exp \left(-{\frac {2i\pi }{n+1}}\right)}
である。
さらに他の方法も提案されている[ 4] 。
平均と分散
ポアソン二項分布は独立なベルヌーイ分布に従う n 個の確率変数の和だから、その平均と分散は各ベルヌーイ分布における平均および分散の和となる。
μ μ -->
=
∑ ∑ -->
i
=
1
n
p
i
{\displaystyle \mu =\sum _{i=1}^{n}p_{i}}
σ σ -->
2
=
∑ ∑ -->
i
=
1
n
(
1
− − -->
p
i
)
p
i
{\displaystyle \sigma ^{2}=\sum _{i=1}^{n}(1-p_{i})p_{i}}
レ・カムの定理
次の定理がルーシェン・レ・カム (Lucien le Cam ) によって示された[ 5] [ 6] 。
次のように仮定する。
X 1 , …, Xn はそれぞれベルヌーイ分布 に従う独立な確率変数とする。(すなわち 0 か 1 の値をとる)ただしそれぞれが同一の分布である必要はない。(発生確率がそれぞれ異なっていてもよい) 各 i = 1, 2, 3, … に対して、
Pr
(
X
i
=
1
)
=
p
i
{\displaystyle \Pr(X_{i}=1)=p_{i}}
とする。
λ λ -->
n
=
p
1
+
⋯ ⋯ -->
+
p
n
.
{\displaystyle \lambda _{n}=p_{1}+\cdots +p_{n}.}
S
n
=
X
1
+
⋯ ⋯ -->
+
X
n
.
{\displaystyle S_{n}=X_{1}+\cdots +X_{n}.}
(すなわち Sn はポアソン二項分布に従う。)
このとき、
∑ ∑ -->
k
=
0
∞ ∞ -->
|
Pr
(
S
n
=
k
)
− − -->
λ λ -->
n
k
e
− − -->
λ λ -->
n
k
!
|
<
2
∑ ∑ -->
i
=
1
n
p
i
2
.
{\displaystyle \sum _{k=0}^{\infty }\left|\Pr(S_{n}=k)-{\lambda _{n}^{k}e^{-\lambda _{n}} \over k!}\right|<2\sum _{i=1}^{n}{p_{i}}^{2}.}
換言すれば、この和はポアソン分布 で近似できる。
各分布がすべて同じ値
p
i
=
λ λ -->
n
n
{\displaystyle p_{i}={\frac {\lambda _{n}}{n}}}
とすれば、右辺は
2
λ λ -->
n
2
n
{\displaystyle 2{\frac {{\lambda _{n}}^{2}}{n}}}
となる。すなわち、この定理は、二項分布の極限がポアソン分布 になるというポアソンの極限定理 の一般化である。
関連項目
出典
^ Wang, Y. H. (1993), “On the number of successes in independent trials” (PDF), Statistica Sinica 3 (2): 295-312, http://www3.stat.sinica.edu.tw/statistica/oldpdf/A3n23.pdf 2010年2月20日 閲覧。
^ Chen, X. H; A. P Dempster, J. S Liu (1994), “Weighted finite population sampling to maximize entropy” (PDF), Biometrika 81 (3): 457-469, http://www.people.fas.harvard.edu/~junliu/TechRept/94folder/cdl94.pdf 2010年2月20日 閲覧。
^ Fernandez, M.; S. Williams (2010), “Closed-Form Expression for the Poisson-Binomial Probability Density Function”, IEEE Transactions on Aerospace Electronic Systems 46 : 803-817, doi :10.1109/TAES.2010.5461658
^ Chen, S. X; J. S Liu (1997), “Statistical Applications of the Poisson-Binomial and conditional Bernoulli distributions” , Statistica Sinica 7 : 875-892, http://www3.stat.sinica.edu.tw/statistica/password.asp?vol=7&num=4&art=4 2010年2月20日 閲覧。
^ Le Cam, L. (1960), “An Approximation Theorem for the Poisson Binomial Distribution” (PDF), Pacific Journal of Mathematics 10 (4): 1181-1197, MR 0142174 . Zbl 0118.33601 , http://projecteuclid.org/euclid.pjm/1103038058 2010年2月20日 閲覧。
^ Le Cam, L. (1963), Jerzy Neyman ; Lucien le Cam, eds., On the Distribution of Sums of Independent Random Variables , New York: Springer-Verlag, pp. 179-202, MR 0199871
参考文献
離散単変量で 有限台 離散単変量で 無限台 連続単変量で 有界区間に台を持つ 連続単変量で 半無限区間に台を持つ 連続単変量で 実数直線全体に台を持つ 連続単変量で タイプの変わる台を持つ 混連続-離散単変量 多変量 (結合) 方向 退化 と特異 族 サンプリング法 (英語版 )