Завдання: Прогнозування Цін на Житло
Тепер ви створите модель регресії на реальному прикладі. У вас є файл houses_simple.csv, який містить інформацію про ціни на житло з площею як ознакою.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Наступний крок — призначити змінні та візуалізувати набір даних:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
У прикладі з ростом людини було значно легше уявити лінію, яка добре підходить до даних.
Але зараз наші дані мають значно більшу дисперсію, оскільки цільова змінна сильно залежить від багатьох інших факторів, таких як вік, розташування, інтер'єр тощо.
У будь-якому випадку, завдання полягає у побудові лінії, яка найкраще підходить до наявних даних; вона покаже тенденцію. Для цього слід використовувати клас OLS. Незабаром ми дізнаємося, як додати більше ознак, що покращить прогнозування!
Swipe to start coding
- Призначити стовпець
'price'зdfзміннійy. - Створити матрицю
X_tildeза допомогою функціїadd_constant()з пакетуstatsmodels(імпортовано якsm). - Ініціалізувати об'єкт
OLSта навчити його. - Передобробити масив
X_newтак само, як іX. - Передбачити цільове значення для матриці
X_new_tilde.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
What is the OLS class and how do I use it for regression?
Can you explain why adding more features improves prediction?
What does the scatter plot tell us about the data?
Awesome!
Completion rate improved to 5.26
Завдання: Прогнозування Цін на Житло
Свайпніть щоб показати меню
Тепер ви створите модель регресії на реальному прикладі. У вас є файл houses_simple.csv, який містить інформацію про ціни на житло з площею як ознакою.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Наступний крок — призначити змінні та візуалізувати набір даних:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
У прикладі з ростом людини було значно легше уявити лінію, яка добре підходить до даних.
Але зараз наші дані мають значно більшу дисперсію, оскільки цільова змінна сильно залежить від багатьох інших факторів, таких як вік, розташування, інтер'єр тощо.
У будь-якому випадку, завдання полягає у побудові лінії, яка найкраще підходить до наявних даних; вона покаже тенденцію. Для цього слід використовувати клас OLS. Незабаром ми дізнаємося, як додати більше ознак, що покращить прогнозування!
Swipe to start coding
- Призначити стовпець
'price'зdfзміннійy. - Створити матрицю
X_tildeза допомогою функціїadd_constant()з пакетуstatsmodels(імпортовано якsm). - Ініціалізувати об'єкт
OLSта навчити його. - Передобробити масив
X_newтак само, як іX. - Передбачити цільове значення для матриці
X_new_tilde.
Рішення
Дякуємо за ваш відгук!
single