学ぶ MSE、RMSE、MAE | セクション

メニューを表示するにはスワイプしてください

回帰モデルを評価するには、モデルの予測値が実際の値にどれだけ近いかを測定する信頼性の高い方法が必要です。この目的で最も広く使用されている指標が、平均二乗誤差（MSE）、二乗平均平方根誤差（RMSE）、および**平均絶対誤差（MAE）**です。これらの指標は、すべてのサンプルにおける予測値（ $\hat{y}_i$ ）と真の値（ $y_i$ ）の平均的な差を定量化します。

平均二乗誤差（MSE）：

MSEは誤差の二乗の平均を計算します：

\mathrm{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2

ここで、 $n$ はサンプル数、 $y_i$ は真の値、 $\hat{y}_i$ は $i$ 番目のサンプルに対する予測値です。

二乗平均平方根誤差（RMSE）：

RMSEはMSEの平方根を取ったもので、誤差指標を出力変数の元の単位に戻します：

\mathrm{RMSE} = \sqrt{\mathrm{MSE}} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2}

平均絶対誤差（MAE）：

MAEは予測値と実際の値の絶対値の差の平均を計算します：

\mathrm{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|

これらの各指標は、観測値とその予測値の差である誤差の概念を用いて、モデルの性能を要約します。


              12345678910111213141516171819
            
from sklearn.metrics import mean_squared_error, mean_absolute_error
import numpy as np

# Example true values and predictions
y_true = np.array([3.0, -0.5, 2.0, 7.0])
y_pred = np.array([2.5, 0.0, 2.1, 7.8])

# Calculate Mean Squared Error
mse = mean_squared_error(y_true, y_pred)

# Calculate Root Mean Squared Error
rmse = np.sqrt(mean_squared_error(y_true, y_pred))

# Calculate Mean Absolute Error
mae = mean_absolute_error(y_true, y_pred)

print(f"MSE: {mse:.3f}")
print(f"RMSE: {rmse:.3f}")
print(f"MAE: {mae:.3f}")

MSE、RMSE、MAEのいずれを選択するかを判断する際には、それぞれの指標が大きな誤差（外れ値）にどのように反応するかを理解する必要があります。MSEとRMSEは、誤差を二乗してから平均を取るため、大きな誤差をより厳しく評価します。つまり、1つの大きな誤差がMSEやRMSEの値を大きく押し上げる可能性があり、これらの指標は外れ値に非常に敏感です。RMSEは、誤差指標を目的変数と同じ単位で表現しつつ、大きな誤差を強調したい場合によく用いられます。

一方、MAEは各誤差の絶対値を取ることで、すべての誤差を同等に扱い、外れ値に対してより頑健です。MAEは平均的な誤差の大きさを直接的に解釈できますが、MSEやRMSEほど大きな誤差を強調しません。

指標選択のガイダンス：

大きな誤差をより重視し、外れ値の影響を考慮したい場合はMSEまたはRMSEを使用；
外れ値に対して感度が低く、平均的な誤差を単純に測りたい場合はMAEを使用；
回帰問題における指標選択時には、常に状況やビジネス上の誤差の影響を考慮すること。

すべて明確でしたか？

フィードバックありがとうございます！

セクション 1. 章 2

AIに質問する

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 1. 章 2