セクション 1. 章 5
single
チャレンジ:住宅価格の予測
メニューを表示するにはスワイプしてください
これから実際の回帰モデルを構築します。houses_simple.csv というファイルには、面積を特徴量とした住宅価格に関する情報が含まれています。
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
次のステップは、変数の割り当てとデータセットの可視化です。
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
身長の例では、データにうまく当てはまる直線を想像するのははるかに簡単でした。
しかし、今回のデータはばらつきが大きく、ターゲットは年齢、場所、内装など多くの要素に大きく依存しています。
それでも、与えられたデータに最もよく当てはまる直線を作成することが課題です。これにより傾向を示すことができます。そのためには OLS クラスを使用します。今後、特徴量を追加する方法も学びます。これにより予測精度が向上します。
タスク
スワイプしてコーディングを開始
'price'のdf列をyに代入します。X_tilde(add_constant()としてインポート)のstatsmodels関数を用いてsm行列を作成します。OLSオブジェクトを初期化し、学習します。X_new配列をXと同様に前処理します。X_new_tilde行列のターゲット値を予測します。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 1. 章 5
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください