メニューを表示するにはスワイプしてください

データ前処理とパイプライン構築の基本を学びました。次のステップはモデリングです。

Scikit-learnにおけるモデルは、.predict()および.score()メソッドを提供する**推定器（estimator）**であり、すべての推定器から継承された.fit()メソッドも備えています。

.fit()

データの前処理が完了し、モデルに渡す準備ができたら、モデル構築の最初のステップはモデルの学習。これは .fit(X, y) を使用して実行。

注意

教師あり学習（回帰、分類）の場合、.fit() には X と y の両方が必要。 教師なし学習（例：クラスタリング）の場合は、.fit(X) のみを呼び出す。y を渡してもエラーにはならず、単に無視される。

学習中、モデルは予測に必要なパターンを学習。何を学習するか、学習にかかる時間はアルゴリズムによって異なる。特に大規模なデータセットでは、学習は機械学習の中で最も時間がかかる部分となることが多い。

.predict()

トレーニング後、.predict() を使用して予測を生成:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() は、通常 テストセット でトレーニング済みモデルを評価:

model.fit(X, y)
model.score(X_test, y_test)

予測値と正解ターゲットを比較。デフォルトでは、分類の場合は 正解率 が指標。

ノート

X_test は、モデルのトレーニング後にパフォーマンスを評価するために使用されるデータセットのサブセットであるテストセットを指します。これは特徴量（入力データ）を含みます。y_test は X_test に対応する正解ラベルのサブセットです。これらを組み合わせて、モデルが新しい未知のデータをどれだけ正確に予測できるかを評価します。

すべて明確でしたか？

フィードバックありがとうございます！

セクション 4. 章 1

AIに質問する

何でも質問するか、提案された質問の1つを試してチャットを始めてください

モデル