連続一様分布 (英 : continuous uniform distribution )は、確率論 や統計学 における連続確率分布 の一種であり、分布上の同じ長さの区間が等しく確からしい場合である。台は2つの母数 a と b で定義され、それぞれ最小値と最大値である。この分布を U (a , b ) と略記することが多い。
無限型確率変数 の中で、等確率空間 である(つまり、根元事象全体が同様に確からしい)唯一の場合である。
特性
確率密度関数
連続一様分布の確率密度関数 は次の通りである。
f
(
x
)
=
{
1
b
− − -->
a
for
a
≤ ≤ -->
x
≤ ≤ -->
b
,
0
for
x
<
a
or
x
>
b
,
{\displaystyle f(x)={\begin{cases}{\dfrac {1}{b-a}}&{\text{for }}a\leq x\leq b,\\[1ex]0&{\text{for }}x<a{\text{ or }}x>b,\end{cases}}}
2つの境界 a と b での値は、f (x ) dx の任意の区間での積分に影響を与えないし、x f (x ) dx の積分にも影響を与えないため、通常あまり重視されない。したがって、0 とする場合もあるし、1 / b − a とする場合もある。後者は最尤法 による推定の場合によく見られる。フーリエ解析 においては、f (a ) や f (b ) の値を 1 / 2(b − a ) とすることもある。そうすると、この一様関数の積分変換 の逆変換は元の関数自身に戻る。さもないと「ほとんど至るところで 」等しい関数に戻る。すなわち、零集合 以外で等しい関数になる。また、このような曖昧さのない符号関数 の定義とも一貫する。
累積分布関数
累積分布関数 は次の通りである。
F
(
x
)
=
{
0
for
x
<
a
x
− − -->
a
b
− − -->
a
for
a
≤ ≤ -->
x
<
b
1
for
x
≥ ≥ -->
b
{\displaystyle F(x)={\begin{cases}0&{\text{for }}x<a\\{\dfrac {x-a}{b-a}}&{\mbox{for }}a\leq x<b\\1&{\mbox{for }}x\geq b\end{cases}}}
母関数
積率母関数
積率母関数 は次の通りである。
M
x
=
E
(
e
t
x
)
=
e
t
b
− − -->
e
t
a
t
(
b
− − -->
a
)
{\displaystyle M_{x}=E(e^{tx})={\frac {e^{tb}-e^{ta}}{t(b-a)}}}
ここから積率 mk を計算することができる。
m
1
=
a
+
b
2
,
m
2
=
a
2
+
a
b
+
b
2
3
,
m
k
=
1
k
+
1
∑ ∑ -->
i
=
0
k
a
i
b
k
− − -->
i
.
{\displaystyle {\begin{aligned}m_{1}&={\frac {a+b}{2}},\\m_{2}&={\frac {a^{2}+ab+b^{2}}{3}},\\m_{k}&={\frac {1}{k+1}}\sum _{i=0}^{k}a^{i}b^{k-i}.\\\end{aligned}}}
この分布に従う確率変数 では、期待値 は m 1 = a + b / 2 となり、分散 は
m
2
− − -->
m
1
2
=
(
b
− − -->
a
)
2
12
{\displaystyle m_{2}-{m_{1}}^{2}={\frac {(b-a)^{2}}{12}}}
となる。
キュムラント母関数
n ≥ 2 のとき、区間 [0, 1] 上の一様分布の n 番目のキュムラント は
b
n
n
{\displaystyle {\frac {b_{n}}{n}}}
であり、ここで bn は n 番目のベルヌーイ数 である。
属性
ボレル集合への一般化
この分布は区間よりも複雑な集合に一般化することができる。S を正の有限測度のボレル集合 としたとき、S 上の一様分布の確率密度関数は、S の範囲外ではゼロで S 上では 1 / K という一定の値をとる。ここで K は S のルベーグ測度 である。
順序統計量
X 1 , …, Xn が U (0, 1) からの独立同分布 (i.i.d.) の標本とする。X (k ) がこの標本における k 番目の順序統計量 とする。すると、X (k ) の確率分布は k と n − k + 1 を母数とするベータ分布 である。期待値は次のようになる。
E
-->
(
X
(
k
)
)
=
k
n
+
1
{\displaystyle \operatorname {E} (X_{(k)})={\frac {k}{n+1}}}
このことは、Q-Qプロット を作成する際に便利である。
分散は次のようになる。
Var
-->
(
X
(
k
)
)
=
k
(
n
− − -->
k
+
1
)
(
n
+
1
)
2
(
n
+
2
)
{\displaystyle \operatorname {Var} (X_{(k)})={\frac {k(n-k+1)}{(n+1)^{2}(n+2)}}}
一様性
一様分布する確率変数の任意の固定長の区間での確率は、その区間が分布の台に含まれる限りにおいて、その区間自体の位置とは独立である(ただし、区間の長さには依存する)。
これを示すため、X ≈ U (0, b ) で [x , x + d ] が [0, b ] の部分区間であり、定数 d > 0 とすると、
P
(
X
∈ ∈ -->
[
x
,
x
+
d
]
)
=
∫ ∫ -->
x
x
+
d
d
y
b
− − -->
a
=
d
b
− − -->
a
{\displaystyle P\left(X\in \left[x,x+d\right]\right)=\int _{x}^{x+d}{\frac {\mathrm {d} y}{b-a}}\,={\frac {d}{b-a}}}
となり、x とは独立となる。この事実から「一様」分布と名付けられた。
標準一様
a = 0 かつ b = 1 に限定したときの分布 U (0, 1) を標準一様分布 (standard uniform distribution) と呼ぶ。
標準一様分布の興味深い属性として、u 1 が標準一様分布を持つなら、1 − u 1 も同様である。この属性は、対照変量法 など様々な分野で利用されている。
関連する分布
X が標準一様分布であるとき、逆関数法 により、Y = −ln(X ) / λ はパラメータ λ の指数分布 となる。
Y
=
1
− − -->
X
1
/
n
{\displaystyle Y=1-X^{1/n}}
はパラメータが 1 と n のベータ分布 である。なお、このことは、標準一様分布がパラメータ 1 と 1 のベータ分布の特殊ケースであることを意味する。
2つの独立同分布の一様分布の総和は対称な三角分布 となる。
一様分布に従う独立な確率変数の和はアーウィン゠ホール分布 (英語版 ) に従う。
他の関数との関係
遷移点の扱いが同じであれば、連続一様分布の確率密度関数はヘヴィサイドの階段関数 を使って次のように表すこともできる。
f
(
x
)
=
H
-->
(
x
− − -->
a
)
− − -->
H
-->
(
x
− − -->
b
)
b
− − -->
a
{\displaystyle f(x)={\frac {\operatorname {H} (x-a)-\operatorname {H} (x-b)}{b-a}}}
あるいは、矩形関数 を使って次のように表すこともできる。
f
(
x
)
=
1
b
− − -->
a
rect
-->
(
x
− − -->
(
a
+
b
)
/
2
b
− − -->
a
)
{\displaystyle f(x)={\frac {1}{b-a}}\,\operatorname {rect} \left({\frac {x-(a+b)/2}{b-a}}\right)}
符号関数 の遷移点の解釈には曖昧さがない。遷移点が符号関数と同じく半分の値をとるとした場合、一様分布は符号関数を使って次のように表せる。
f
(
x
)
=
sgn
-->
(
x
− − -->
a
)
− − -->
sgn
-->
(
x
− − -->
b
)
2
(
b
− − -->
a
)
{\displaystyle f(x)={\frac {\operatorname {sgn}(x-a)-\operatorname {sgn}(x-b)}{2(b-a)}}}
応用
統計学 において、単純な帰無仮説 の検定統計量としてp値 を使う場合、検定統計量の分布が連続なら、帰無仮説が真のとき検定統計量(p値)は0と1の間で一様分布する。
一様分布からの標本化
シミュレーション実験には多くの有益な応用がある。多くのプログラミング言語 には擬似乱数 列を生成する機能があり、事実上それらは標準一様分布に従って分布している。
標準一様分布からの標本値 u があるとき、a + (b − a )u という値は上述の通り母数 a と b の一様分布に従った値となる。
任意の分布からの標本化
一様分布は任意の分布からの標本化にも有効である。汎用的手法として逆関数法 があり、対象とする確率変数の累積分布関数 を使う。理論的研究では非常に便利な手法である。シミュレーションでこの手法を使う場合、対象とする変数のCDFを知っている必要があるため、閉形式のCDFが未知の場合について代替手法が生み出されてきた。例えば、棄却サンプリング法 がある。
正規分布 は、逆関数法が効果的でない重要な例である。しかしボックス-ミューラー変換 という正確な手法があり、2つの独立で一様な確率変数 を独立な正規分布 の確率変数に変えるため、逆変換を使う。
推定
最大値の推定
区間 [0, N ] 上の一様分布について、N が未知の場合、最大値のUMVU 推定は次のようになる。
N
^ ^ -->
=
k
+
1
k
m
=
m
+
m
k
{\displaystyle {\hat {N}}={\frac {k+1}{k}}m=m+{\frac {m}{k}}}
ここで m は標本 の最大値、k は標本の大きさ(数)であり、標本の順序は入れ替えない(ただし、連続分布ではこの限定はほとんど意味を持たない)。これは離散分布での推定 と同じ理由で、maximum spacing estimation の非常に単純な例と見ることができる。このような問題を一般に German tank problem (ドイツ戦車問題)と呼び、第二次世界大戦 中のドイツでの戦車生産数の最大値を推定するという問題に由来する。
中点の推定
分布の中点 a + b / 2 は、一様分布の期待値であり中央値である。標本の平均値と標本の中央値は母集団の中点のバイアスのない推定値だが、どちらも標本の範囲中央 (標本の最大値と最小値の平均)ほど効率的ではない。それが中点のUMVU 推定である(また、最尤推定値 である)。
関連項目
離散単変量で 有限台 離散単変量で 無限台 連続単変量で 有界区間に台を持つ 連続単変量で 半無限区間に台を持つ 連続単変量で 実数直線全体に台を持つ 連続単変量で タイプの変わる台を持つ 混連続-離散単変量 多変量 (結合) 方向 退化 と特異 族 サンプリング法 (英語版 )