統計学および機械学習の評価指標(とうけいがくおよびきかいがくしゅうのひょうかしひょう)では統計学および(教師ありの)機械学習の評価指標について述べる。
回帰に対する評価指標
以下のものがある[1][2][3]。観測値を、推定値をと表す。これらの評価指標は代表的なPythonのオープンソース機械学習ライブラリscikit-learnではmetricsモジュールに実装されており、評価指標を計算する関数を併記する。
略称
|
名称(英語)
|
名称(日本語)
|
定義
|
scikit-learnのmetricsモジュールでの関数
|
MSE
|
Mean Squared Error
|
平均二乗誤差
|
|
mean_squared_error(y_true,y_pred)
|
RMSE
|
Root Mean Squared Error
|
二乗平均平方根誤差
|
|
np.root(mean_squared_error(y_true,y_pred))
|
MAE
|
Mean Absolute Error
|
平均絶対誤差
|
|
mean_absolute_error(y_true,y_pred)
|
MAPE
|
Mean Absolute Percentage Error
|
平均絶対誤差率
|
|
|
RMSPE
|
Root Mean Squared Percentage Error
|
平均二乗パーセント誤差の平方根
|
|
|
RMSLE
|
Root Mean Squared Logarithmic Error
|
|
|
mean_squared_log_error(y_true,y_pred)
|
|
coefficient of determination
|
決定係数
|
、ここで
|
r2_score(y_true,y_pred)
|
ただし、決定係数は上に挙げたものの他に7種類の定義が知られている。
二値分類
混同行列
|
実際の値
|
正
|
負
|
予
測
値
|
正
|
真陽性
True Positive(TP)
|
偽陽性
False Positive(FP)
|
負
|
偽陰性
False Negative(FN)
|
真陰性
True Negative(TN)
|
scikit-learnではmetricsモジュールの「confusion_matrix(y_true, y_pred)」。
各種指標
以下のものがある[4][5][6][7][8]:
|
実際の値
|
総数
|
割合
|
正
|
負
|
正
|
負
|
予
測
値
|
総
数
|
正
|
真陽性
True Positive(TP)
|
偽陽性
False Positive(FP)
第一種の過誤
|
陽性適中率(Positive Prediction Value、PPV)
適合率(Precision)
|
偽発見率(英語版)(False Discovery Rate、FDR)
|
負
|
偽陰性
False Negative(FN)
第二種の過誤
|
真陰性
True Negative(TN)
|
False Omission Rate (FOR)
|
陰性適中率(Negative Predictive Value 、NPV)
|
割
合
|
正
|
真陽性率(True Positive Rate 、TPR)、再現率(Recall)、感度(Sensitivity)、Hit Rate
|
偽陽性率(False Positive Rate 、FPR)、
Fall-out
|
|
負
|
偽陰性率(False Negative Rate、FNR)、Miss Rate
|
真陰性率(True Negative Rate 、TNR)、
特異性(Specificity)、
Selectivity
|
scikit-learnではmetricsモジュールの下記の関数を呼び出すことで計算可能:
- 適合率:precision_score(y_true, y_pred)
- 再現率:recall_score(y_true, y_pred)
脚注