モデル
メニューを表示するにはスワイプしてください
データの前処理とパイプライン構築の基本がカバーされました。次のステップはモデリングです。
Scikit-learnにおけるモデルは、.predict()および.score()メソッドを提供する**推定器(estimator)**であり、すべての推定器から継承された.fit()も備えています。
.fit()
データの前処理が完了し、モデルに渡す準備ができたら、モデル構築の最初のステップはモデルの学習です。これは.fit(X, y)を使用して行います。
教師あり学習(回帰、分類)の場合、.fit() には X と y の両方が必要。
教師なし学習(例:クラスタリング)の場合は、.fit(X) のみを呼び出す。y を渡してもエラーにはならず、単に無視される。
トレーニング中、モデルは予測に必要なパターンを学習。学習内容やトレーニング時間はアルゴリズムによって異なる。トレーニングは特に大規模データセットでは最も時間がかかる部分。
.predict()
トレーニング後、.predict() を使用して予測を生成:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() は、通常 テストセット 上で訓練済みモデルを評価するメソッド。
model.fit(X, y)
model.score(X_test, y_test)
予測値と正解ラベルを比較する。デフォルトでは、分類問題の場合は 正解率(accuracy) が評価指標となる。
X_test は、モデルの性能を訓練後に評価するために使用されるデータセットのサブセット(テストセット)を指す。これは 特徴量(入力データ)を含む。y_test は X_test に対応する 正解ラベル のサブセット。これらを用いて、モデルが未知のデータをどれだけ正確に予測できるかを評価する。
フィードバックありがとうございます!
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください