モデル
メニューを表示するにはスワイプしてください
データ前処理とパイプライン構築の基本を学びました。次のステップはモデリングです。
Scikit-learnにおけるモデルは、.predict()および.score()メソッドを提供する**推定器(estimator)**であり、すべての推定器から継承された.fit()メソッドも備えています。
.fit()
データの前処理が完了し、モデルに渡す準備ができたら、モデル構築の最初のステップはモデルの学習。これは .fit(X, y) を使用して実行。
教師あり学習(回帰、分類)の場合、.fit() には X と y の両方が必要。
教師なし学習(例:クラスタリング)の場合は、.fit(X) のみを呼び出す。y を渡してもエラーにはならず、単に無視される。
学習中、モデルは予測に必要なパターンを学習。何を学習するか、学習にかかる時間はアルゴリズムによって異なる。特に大規模なデータセットでは、学習は機械学習の中で最も時間がかかる部分となることが多い。
.predict()
トレーニング後、.predict() を使用して予測を生成:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() は、通常 テストセット でトレーニング済みモデルを評価:
model.fit(X, y)
model.score(X_test, y_test)
予測値と正解ターゲットを比較。デフォルトでは、分類の場合は 正解率 が指標。
X_test は、モデルのトレーニング後にパフォーマンスを評価するために使用されるデータセットのサブセットであるテストセットを指します。これは特徴量(入力データ)を含みます。y_test は X_test に対応する正解ラベルのサブセットです。これらを組み合わせて、モデルが新しい未知のデータをどれだけ正確に予測できるかを評価します。
フィードバックありがとうございます!
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください