セクション 3. 章 5
single
チャレンジ:モデルの評価
メニューを表示するにはスワイプしてください
このチャレンジでは、従来の住宅データセットが与えられていますが、今回は 'age' 特徴量のみが含まれています。
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_poly.csv') print(df.head())
次に、このデータの散布図を作成します。
12345678import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_poly.csv') X = df['age'] y = df['price'] plt.scatter(X, y, alpha=0.4) plt.show()
直線はここでは適切なフィットではありません。価格は非常に新しい家と非常に古い家の両方で上昇しています。この傾向には放物線の方が適しています。このチャレンジではそのモデルを構築します。
始める前に、PolynomialFeatures クラスを思い出してください。
fit_transform(X) は2次元配列またはDataFrameが必要。df[['col']]を使用するか、1次元配列の場合は .reshape(-1, 1) を適用して2次元に変換。
PolynomialFeatures と OLS を用いた2次の多項式回帰モデルの構築。
タスク
スワイプしてコーディングを開始
X変数に、'age'列を含むDataFrameを代入。X_tildeクラスを使用してPolynomialFeatures行列を作成。- 多項式回帰モデルを構築し、学習。
X_newを2次元配列に変形。X_newと同様にXを前処理。- モデルのパラメータを出力。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 3. 章 5
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください