セクション 4. 章 4
single
チャレンジ:多項式回帰を用いた価格予測
メニューを表示するにはスワイプしてください
このチャレンジでは、前回のチャレンジと同様に2次の多項式回帰モデルを構築します。ただし、今回はデータセットをトレーニングセットとテストセットに分割し、それぞれのセットに対してRMSEを計算する必要があります。これは、モデルが過学習または過少学習しているかどうかを判断するために必要です。
使用するべきtrain_test_split()関数のリマインダーを以下に示します。
また、RMSEを計算するために必要なmean_squared_error()関数とnp.sqrt()のリマインダーも示します:
rmse = np.sqrt(mean_squared_error(y_true, y_predicted))
タスク
スワイプしてコーディングを開始
'age'の単一カラムdfをX変数に代入。Xクラスを用いてPolynomialFeaturesを前処理。sklearnの適切な関数を使ってデータセットを分割。- 訓練セットでモデルを構築・学習。
- 訓練セットおよびテストセットのターゲットを予測。
- 訓練セットとテストセットの両方でRMSEを計算。
- サマリーテーブルを出力。
解答
タスクを完了すると、テストRMSEがトレーニングRMSEよりも低くなることに気付くでしょう。通常、モデルは未知のデータに対してより良い結果を示すことはありません。ここでは、その差は非常に小さく、偶然によるものです。データセットが比較的小さく、分割時にテストセットに予測しやすいデータポイントが割り当てられたためです。
すべて明確でしたか?
フィードバックありがとうございます!
セクション 4. 章 4
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください