Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ モデル | モデリング
Pythonによる機械学習入門

モデル

メニューを表示するにはスワイプしてください

データ前処理とパイプライン構築の基本を学びました。次のステップはモデリングです。

Scikit-learnにおけるモデルは、.predict()および.score()メソッドを提供する**推定器(estimator)**であり、すべての推定器から継承された.fit()メソッドも備えています。

モデル

.fit()

データの前処理が完了し、モデルに渡す準備ができたら、モデル構築の最初のステップはモデルの学習。これは .fit(X, y) を使用して実行。

Note
注意

教師あり学習(回帰、分類)の場合、.fit() には Xy の両方が必要。 教師なし学習(例:クラスタリング)の場合は、.fit(X) のみを呼び出す。y を渡してもエラーにはならず、単に無視される。

学習中、モデルは予測に必要なパターンを学習。何を学習するか、学習にかかる時間はアルゴリズムによって異なる。特に大規模なデータセットでは、学習は機械学習の中で最も時間がかかる部分となることが多い。

.predict()

トレーニング後、.predict() を使用して予測を生成:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() は、通常 テストセット でトレーニング済みモデルを評価:

model.fit(X, y)
model.score(X_test, y_test)

予測値と正解ターゲットを比較。デフォルトでは、分類の場合は 正解率 が指標。

正解率
Note
ノート

X_test は、モデルのトレーニング後にパフォーマンスを評価するために使用されるデータセットのサブセットであるテストセットを指します。これは特徴量(入力データ)を含みます。y_testX_test に対応する正解ラベルのサブセットです。これらを組み合わせて、モデルが新しい未知のデータをどれだけ正確に予測できるかを評価します。

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 4.  1

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 4.  1
some-alt