Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ チャレンジ:住宅価格の予測 | セクション
Pythonによる回帰
セクション 1.  5
single

single

bookチャレンジ:住宅価格の予測

メニューを表示するにはスワイプしてください

これから実際の回帰モデルを構築します。houses_simple.csv というファイルには、面積を特徴量とした住宅価格に関する情報が含まれています。

1234
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
copy

次のステップは、変数の割り当てとデータセットの可視化です。

123456789
import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
copy

身長の例では、データにうまく当てはまる直線を想像するのははるかに簡単でした。

しかし、今回のデータはばらつきが大きく、ターゲットは年齢、場所、内装など多くの要素に大きく依存しています。 それでも、与えられたデータに最もよく当てはまる直線を作成することが課題です。これにより傾向を示すことができます。そのためには OLS クラスを使用します。今後、特徴量を追加する方法も学びます。これにより予測精度が向上します。

タスク

スワイプしてコーディングを開始

  1. 'price'df 列を y に代入します。
  2. X_tildeadd_constant() としてインポート)の statsmodels 関数を用いて sm 行列を作成します。
  3. OLS オブジェクトを初期化し、学習します。
  4. X_new 配列を X と同様に前処理します。
  5. X_new_tilde 行列のターゲット値を予測します。

解答

Switch to desktop実践的な練習のためにデスクトップに切り替える下記のオプションのいずれかを利用して、現在の場所から続行する
すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 1.  5
single

single

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

some-alt