Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ チャレンジ:多項式回帰を用いた価格予測 | 最適なモデルの選択
Pythonによる線形回帰
セクション 4.  4
single

single

bookチャレンジ:多項式回帰を用いた価格予測

メニューを表示するにはスワイプしてください

このチャレンジでは、前回のチャレンジと同様に2次の多項式回帰モデルを構築します。ただし、今回はデータセットをトレーニングセットとテストセットに分割し、それぞれのセットに対してRMSEを計算する必要があります。これは、モデルが過学習または過少学習しているかどうかを判断するために必要です。
使用するべきtrain_test_split()関数のリマインダーを以下に示します。

また、RMSEを計算するために必要なmean_squared_error()関数とnp.sqrt()のリマインダーも示します:

rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
タスク

スワイプしてコーディングを開始

  1. 'age'の単一カラム dfX 変数に代入。
  2. X クラスを用いて PolynomialFeatures を前処理。
  3. sklearn の適切な関数を使ってデータセットを分割。
  4. 訓練セットでモデルを構築・学習。
  5. 訓練セットおよびテストセットのターゲットを予測。
  6. 訓練セットとテストセットの両方でRMSEを計算。
  7. サマリーテーブルを出力。

解答

タスクを完了すると、テストRMSEがトレーニングRMSEよりも低くなることに気付くでしょう。通常、モデルは未知のデータに対してより良い結果を示すことはありません。ここでは、その差は非常に小さく、偶然によるものです。データセットが比較的小さく、分割時にテストセットに予測しやすいデータポイントが割り当てられたためです。

Switch to desktop実践的な練習のためにデスクトップに切り替える下記のオプションのいずれかを利用して、現在の場所から続行する
すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 4.  4
single

single

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

some-alt