メニューを表示するにはスワイプしてください

R²スコア（決定係数）は、回帰モデルの評価における主要な指標。従属変数の分散のうち、独立変数から予測可能な割合を測定。MSE、RMSE、MAEなどの平均誤差を定量化する指標に基づき、R²スコアはモデルが単純な平均予測と比較して観測結果をどれだけ説明できるかを正規化して示す。

R²の公式：

R^2 = 1 - \frac{\sum_{i=1}^n (y_i - \hat{y}_i)^2}{\sum_{i=1}^n (y_i - \bar{y})^2}

$y_i$ : 真の値
$\hat{y}_i$ : 予測値
$\bar{y}$ : 真の値の平均

分子はモデルの二乗誤差の合計、分母はデータ全体の分散を表す。R²値が1の場合は完全な予測、0は常に平均を予測するのと同等、負の値は平均を使うよりもモデルの性能が劣ることを示す。


              123456789
            
from sklearn.metrics import r2_score

# Example true values and predictions
y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

# Calculate R² score
r2 = r2_score(y_true, y_pred)
print(f"R² score: {r2:.2f}")

R²値の解釈と限界の理解

R²値の解釈は、モデル性能を文脈で理解するのに役立つ：

R²スコアが1に近い場合、モデルが目的変数の分散の大部分を説明していることを示す；
0に近いスコアは、単純に平均を予測する場合と比べて改善がないことを示す；
負の値は、常に平均を予測するよりもモデルの性能が劣ることを示す。

ただし、R²には重要な限界がある：

予測にバイアスがあるかどうかは示さない；
過学習やモデルの複雑さの問題を検出できない；
特徴量の数が異なるモデルや外れ値を含むデータの比較では誤解を招く可能性がある。

R²は他の回帰指標や検証手法と併用し、モデルの品質を総合的かつ信頼性高く評価することが重要。

すべて明確でしたか？

フィードバックありがとうございます！

セクション 1. 章 3

AIに質問する

何でも質問するか、提案された質問の1つを試してチャットを始めてください

R²スコア