Завдання: Прогнозування Цін на Житло
Тепер ви створите модель регресії на реальному прикладі. У вас є файл houses_simple.csv
, який містить інформацію про ціни на житло з площею як ознакою.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Наступний крок — призначити змінні та візуалізувати набір даних:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
У прикладі з ростом людини було значно легше уявити лінію, яка добре підходить до даних.
Але зараз наші дані мають набагато більшу дисперсію, оскільки цільова змінна значною мірою залежить від багатьох інших факторів, таких як вік, розташування, інтер'єр тощо.
У будь-якому випадку, завдання полягає у побудові лінії, яка найкраще підходить до наявних даних; вона покаже тенденцію. Для цього слід використовувати клас OLS
. Незабаром ми дізнаємося, як додати більше ознак, що покращить прогнозування!
Swipe to start coding
- Призначити стовпець
'price'
зdf
зміннійy
. - Створити матрицю
X_tilde
за допомогою функціїadd_constant()
з пакетуstatsmodels
(імпортовано якsm
). - Ініціалізувати об'єкт
OLS
та навчити його. - Попередньо обробити масив
X_new
так само, як іX
. - Здійснити прогноз цільової змінної для матриці
X_new_tilde
.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 5.26
Завдання: Прогнозування Цін на Житло
Свайпніть щоб показати меню
Тепер ви створите модель регресії на реальному прикладі. У вас є файл houses_simple.csv
, який містить інформацію про ціни на житло з площею як ознакою.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Наступний крок — призначити змінні та візуалізувати набір даних:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
У прикладі з ростом людини було значно легше уявити лінію, яка добре підходить до даних.
Але зараз наші дані мають набагато більшу дисперсію, оскільки цільова змінна значною мірою залежить від багатьох інших факторів, таких як вік, розташування, інтер'єр тощо.
У будь-якому випадку, завдання полягає у побудові лінії, яка найкраще підходить до наявних даних; вона покаже тенденцію. Для цього слід використовувати клас OLS
. Незабаром ми дізнаємося, як додати більше ознак, що покращить прогнозування!
Swipe to start coding
- Призначити стовпець
'price'
зdf
зміннійy
. - Створити матрицю
X_tilde
за допомогою функціїadd_constant()
з пакетуstatsmodels
(імпортовано якsm
). - Ініціалізувати об'єкт
OLS
та навчити його. - Попередньо обробити масив
X_new
так само, як іX
. - Здійснити прогноз цільової змінної для матриці
X_new_tilde
.
Рішення
Дякуємо за ваш відгук!
Awesome!
Completion rate improved to 5.26single