スピアマンの順位相関係数 (スピアマンのじゅんいそうかんけいすう、英 : Spearman's rank correlation coefficient )は統計学 において順位データから求められる相関 の指標である。チャールズ・スピアマン (Charles Spearman)によって提唱され[ 1] 、ふつうρ あるいは rS などと書かれる。
ピアソンの積率相関係数 (普通に相関係数 と呼ばれるもの)と違い、ノンパラメトリックな指標である。すなわち2つの変数の分布 について何も仮定せずに、変数の間の関係が任意の単調関数 によってどの程度忠実に表現できるかを、評価するものである。「変数間の関係は線形 である」と仮定する必要も、また変数を数値的にとる必要もなく、順位が明らかであればよい。
原理的にはスピアマンの順位相関係数はピアソンの積率相関係数の特別な(相関係数を計算する前にデータを順位に変換した)場合に当たる。しかしρ を計算するには普通もっと単純な手順が用いられる。生のスコアを順位に変換し、各観察(各ペア)における2つの変数の順位の差D を計算する。
定義
スピアマンの順位相関係数 ρ は
ρ ρ -->
=
1
− − -->
6
∑ ∑ -->
D
2
N
3
− − -->
N
{\displaystyle \rho =1-{\frac {6\sum D^{2}}{N^{3}-N}}}
で定義される。ただし
D = 対応するX とY の値の順位の差
N = 値のペアの数
である。
同順位(タイ)がある場合には、X 、Y における同順位の個数をそれぞれnx 、ny 、それらの順位をti 、tj (i = 1, 2, ... , nx ;j = 1, 2, ... , ny )として、以下の式を用いる:
ρ ρ -->
=
T
x
+
T
y
− − -->
∑ ∑ -->
D
2
2
T
x
T
y
{\displaystyle \rho ={\frac {T_{x}+T_{y}-\sum D^{2}}{2{\sqrt {T_{x}T_{y}}}}}}
T
x
=
N
3
− − -->
N
− − -->
∑ ∑ -->
(
t
i
3
− − -->
t
i
)
12
{\displaystyle T_{x}={\frac {N^{3}-N-\sum (t_{i}^{3}-t_{i})}{12}}}
T
y
=
N
3
− − -->
N
− − -->
∑ ∑ -->
(
t
j
3
− − -->
t
j
)
12
{\displaystyle T_{y}={\frac {N^{3}-N-\sum (t_{j}^{3}-t_{j})}{12}}}
しかし同順位が少なければそれらを無視して最初の式を用いても影響は小さい。
検定
スピアマンの順位相関係数の母集団の真のρ が有意に0と異なるかどうかを検定 する方法は複数存在する。
標本数が約20以上の場合、観察値のt検定値は
t
=
ρ ρ -->
(
1
− − -->
ρ ρ -->
2
)
/
(
n
− − -->
2
)
{\displaystyle t={\frac {\rho }{\sqrt {(1-\rho ^{2})/(n-2)}}}}
であり、これは帰無仮説 (二変数が相関なし)が真であると仮定した場合、近似的にスチューデントのt分布 自由度n-2に従う。
他にもフィッシャーのz変換を用いてZ値を計算する方法や、パーミュテーションテストを用いる検定方法もある。
また、教科書にはスピアマンの順位相関係数の数表 が載っていることも多く、この数値と比較する方法は、応用範囲が限られていると言うものの煩雑な計算を用いる必要がなく便利である。
脚注
関連項目
外部リンク