Порядковая статистика
Поря́дковые стати́стики в математической статистике — это упорядоченная по неубыванию выборка одинаково распределённых независимых случайных величин и её элементы, занимающие строго определенное место в ранжированной совокупности.
Определение
Пусть
X
1
,
… … -->
,
X
n
{\displaystyle X_{1},\ldots ,X_{n}}
— конечная выборка из распределения
P
X
{\displaystyle \mathbb {P} ^{X}}
, определённая на некотором вероятностном пространстве
(
Ω Ω -->
,
F
,
P
)
{\displaystyle (\Omega ,{\mathcal {F}},\mathbb {P} )}
. Пусть
ω ω -->
∈ ∈ -->
Ω Ω -->
{\displaystyle \omega \in \Omega }
и
x
i
=
X
i
(
ω ω -->
)
,
i
=
1
,
… … -->
,
n
{\displaystyle x_{i}=X_{i}(\omega ),\;i=1,\ldots ,n}
. Перенумеруем последовательность
{
x
i
}
i
=
1
n
{\displaystyle \{x_{i}\}_{i=1}^{n}}
в порядке неубывания, так что
x
(
1
)
≤ ≤ -->
x
(
2
)
≤ ≤ -->
⋯ ⋯ -->
≤ ≤ -->
x
(
n
− − -->
1
)
≤ ≤ -->
x
(
n
)
{\displaystyle x_{(1)}\leq x_{(2)}\leq \cdots \leq x_{(n-1)}\leq x_{(n)}}
.
Эта последовательность называется вариационным рядом . Вариационный ряд и его члены являются порядковыми статистиками. Случайная величина
X
(
k
)
(
ω ω -->
)
=
x
(
k
)
{\displaystyle X_{(k)}(\omega )=x_{(k)}}
называется
k
{\displaystyle k}
-ой порядковой статистикой исходной выборки[ 1] . Порядковые статистики являются основой непараметрических методов.
Замечания
Очевидно из определения:
X
(
1
)
=
min
(
X
1
,
… … -->
,
X
n
)
{\displaystyle X_{(1)}=\min(X_{1},\ldots ,X_{n})}
;
X
(
n
)
=
max
(
X
1
,
… … -->
,
X
n
)
{\displaystyle X_{(n)}=\max(X_{1},\ldots ,X_{n})}
.
Порядковые статистики абсолютно непрерывного распределения
f
X
(
k
)
(
x
)
=
n
!
(
n
− − -->
k
)
!
(
k
− − -->
1
)
!
[
F
X
(
x
)
]
k
− − -->
1
[
1
− − -->
F
X
(
x
)
]
n
− − -->
k
f
X
(
x
)
{\displaystyle f_{X_{(k)}}(x)={\frac {n!}{(n-k)!(k-1)!}}[F_{X}(x)]^{k-1}[1-F_{X}(x)]^{n-k}f_{X}(x)}
.
Случайный вектор
(
X
(
j
)
,
X
(
k
)
)
⊤ ⊤ -->
{\displaystyle \left(X_{(j)},X_{(k)}\right)^{\top }}
, где
1
≤ ≤ -->
j
<
k
≤ ≤ -->
n
{\displaystyle 1\leq j<k\leq n}
также имеет абсолютно непрерывное распределение, и совместная плотность распределения имеет вид:
f
X
(
j
)
,
X
(
k
)
(
x
j
,
x
k
)
=
{
n
!
(
j
− − -->
1
)
!
(
k
− − -->
j
− − -->
1
)
!
(
n
− − -->
k
)
!
[
F
X
(
x
j
)
]
j
− − -->
1
[
F
X
(
x
k
)
− − -->
F
X
(
x
j
)
]
k
− − -->
j
− − -->
1
[
1
− − -->
F
X
(
x
k
)
]
n
− − -->
k
f
X
(
x
j
)
f
X
(
x
k
)
,
x
j
≤ ≤ -->
x
k
0
,
x
j
>
x
k
{\displaystyle f_{X_{(j)},X_{(k)}}(x_{j},x_{k})=\left\{{\begin{matrix}{\frac {n!}{(j-1)!(k-j-1)!(n-k)!}}[F_{X}(x_{j})]^{j-1}[F_{X}(x_{k})-F_{X}(x_{j})]^{k-j-1}[1-F_{X}(x_{k})]^{n-k}f_{X}(x_{j})f_{X}(x_{k}),&x_{j}\leq x_{k}\\0,&x_{j}>x_{k}\end{matrix}}\right.}
.
Пример
Плотности стандартного непрерывного равномерного распределения и его порядковых статистик для случая n=5 .
Пусть
U
1
,
… … -->
,
U
n
∼ ∼ -->
U
[
0
,
1
]
{\displaystyle U_{1},\ldots ,U_{n}\sim \mathrm {U} [0,1]}
- выборка из стандартного непрерывного равномерного распределения . Тогда
f
U
(
k
)
(
u
)
=
n
!
(
n
− − -->
k
)
!
(
k
− − -->
1
)
!
u
k
− − -->
1
[
1
− − -->
u
]
n
− − -->
k
,
u
∈ ∈ -->
[
0
,
1
]
{\displaystyle f_{U_{(k)}}(u)={\frac {n!}{(n-k)!(k-1)!}}u^{k-1}[1-u]^{n-k},\quad u\in [0,1]}
,
то есть
U
(
k
)
∼ ∼ -->
B
(
k
,
n
− − -->
k
+
1
)
{\displaystyle U_{(k)}\sim \mathrm {B} (k,n-k+1)}
, где
B
{\displaystyle \mathrm {B} }
- бета-распределение ;
f
U
(
j
)
,
U
(
k
)
(
u
j
,
u
k
)
=
n
!
(
j
− − -->
1
)
!
(
k
− − -->
j
− − -->
1
)
!
(
n
− − -->
k
)
!
u
j
j
− − -->
1
[
u
k
− − -->
u
j
]
k
− − -->
j
− − -->
1
[
1
− − -->
u
k
]
n
− − -->
k
,
j
<
k
,
0
≤ ≤ -->
u
j
≤ ≤ -->
u
k
≤ ≤ -->
1
{\displaystyle f_{U_{(j)},U_{(k)}}(u_{j},u_{k})={\frac {n!}{(j-1)!(k-j-1)!(n-k)!}}u_{j}^{j-1}[u_{k}-u_{j}]^{k-j-1}[1-u_{k}]^{n-k},\quad j<k,\quad 0\leq u_{j}\leq u_{k}\leq 1}
;
f
U
(
1
)
,
… … -->
,
U
(
n
)
(
u
1
,
… … -->
,
u
n
)
=
n
!
,
0
≤ ≤ -->
u
1
≤ ≤ -->
⋯ ⋯ -->
≤ ≤ -->
u
n
≤ ≤ -->
1
{\displaystyle f_{U_{(1)},\ldots ,U_{(n)}}(u_{1},\ldots ,u_{n})=n!,\quad 0\leq u_{1}\leq \cdots \leq u_{n}\leq 1}
.
См. также
Примечания