メニューを表示するにはスワイプしてください

F1スコアは、特に不均衡なデータセットを扱う際に、分類モデルの評価において重要な指標です。単純に正解予測の割合を測る**正解率（accuracy）とは異なり、F1スコアは適合率（precision）と再現率（recall）**の両方を1つの値に統合します。

適合率は、予測された陽性のうち実際に陽性であった割合を示します。
再現率は、実際の陽性のうち正しく予測された割合を示します。

F1スコアは、適合率と再現率の調和平均として定義されます。調和平均は低い値により大きな重みを与えるため、良いF1スコアを得るには適合率と再現率の両方が高い必要があります。F1スコアの公式は次の通りです：

F1 = 2 \times \frac{\text{precision} \times \text{recall}}{\text{precision} + \text{recall}}

この公式から、F1スコアは適合率と再現率の両方が高い場合のみ高くなることが分かります。どちらか一方が低い場合、F1スコアは大きく下がるため、偽陽性と偽陰性の両方を考慮する必要がある状況でバランスの取れた指標となります。


              12345678910
            
from sklearn.metrics import f1_score

# Simulated true labels and predicted labels for a classification task
y_true = [1, 0, 1, 1, 0, 1, 0, 0, 1, 0]
y_pred = [1, 0, 1, 0, 0, 1, 1, 0, 0, 0]

# Calculate the F1 score
f1 = f1_score(y_true, y_pred)

print(f"F1 Score: {f1:.2f}")

F1スコアは0（最低）から1（最高）までの範囲を持ち、適合率と再現率のバランスを反映します。スコアが1の場合、モデルは適合率と再現率の両方で完璧な結果を達成しており、0に近い場合は両方の性能が低いことを示します。

F1スコアの活用例：

偽陽性と偽陰性の両方が重要な影響を持つモデルの評価；
一方のクラスが他方よりもはるかに多い不均衡データセットでの性能評価；
適合率と再現率の極端なトレードオフを罰する、単一の値でモデルの有効性を要約。

次の場合は正解率よりF1スコアを優先：

データセットに強いクラス不均衡がある；
偽陽性・偽陰性の両方の誤りがコストとなる；
適合率または再現率だけを最適化することを避けたい場合。

モデルが陽性ケースを正確に識別しつつ、過剰な誤警報を出さない能力を総合的に評価したい場合、F1スコアが有効な指標となります。

すべて明確でしたか？

フィードバックありがとうございます！

セクション 1. 章 7

AIに質問する

何でも質問するか、提案された質問の1つを試してチャットを始めてください

F1スコア

適合率は、予測された陽性のうち実際に陽性であった割合を示します。
再現率は、実際の陽性のうち正しく予測された割合を示します。

F1 = 2 \times \frac{\text{precision} \times \text{recall}}{\text{precision} + \text{recall}}


              12345678910
            
from sklearn.metrics import f1_score

# Simulated true labels and predicted labels for a classification task
y_true = [1, 0, 1, 1, 0, 1, 0, 0, 1, 0]
y_pred = [1, 0, 1, 0, 0, 1, 1, 0, 0, 0]

# Calculate the F1 score
f1 = f1_score(y_true, y_pred)

print(f"F1 Score: {f1:.2f}")