Завдання: Прогнозування Цін на Житло
Тепер ви побудуєте модель регресії на реальному прикладі. У вас є файл houses_simple.csv, який містить інформацію про ціни на житло з площею як ознакою.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Наступний крок — призначення змінних і візуалізація набору даних:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
У прикладі з ростом людини було набагато легше уявити собі лінію, яка добре підходить до даних.
Але зараз наші дані мають значно більшу дисперсію, оскільки цільова змінна значною мірою залежить від багатьох інших факторів, таких як вік, розташування, інтер'єр тощо.
У будь-якому випадку, завдання полягає у побудові лінії, яка найкраще відповідає наявним даним; вона покаже тенденцію. Для цього слід використовувати клас OLS. Незабаром ми дізнаємося, як додати більше ознак, що покращить прогнозування!
Swipe to start coding
- Призначте стовпець
'price'зdfзміннійy. - Створіть матрицю
X_tildeза допомогою функціїadd_constant()з пакетуstatsmodels(імпортовано якsm). - Ініціалізуйте об'єкт
OLSта навчіть його. - Попередньо обробіть масив
X_newтак само, як іX. - Здійсніть прогноз цільової змінної для матриці
X_new_tilde.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
What is the OLS class and how do I use it for regression?
Can you explain why adding more features improves prediction?
What does the scatter plot tell us about the data?
Awesome!
Completion rate improved to 5.26
Завдання: Прогнозування Цін на Житло
Свайпніть щоб показати меню
Тепер ви побудуєте модель регресії на реальному прикладі. У вас є файл houses_simple.csv, який містить інформацію про ціни на житло з площею як ознакою.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') print(df.head())
Наступний крок — призначення змінних і візуалізація набору даних:
123456789import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/houses_simple.csv') X = df['square_feet'] y = df['price'] plt.scatter(X, y, alpha=0.5) plt.show()
У прикладі з ростом людини було набагато легше уявити собі лінію, яка добре підходить до даних.
Але зараз наші дані мають значно більшу дисперсію, оскільки цільова змінна значною мірою залежить від багатьох інших факторів, таких як вік, розташування, інтер'єр тощо.
У будь-якому випадку, завдання полягає у побудові лінії, яка найкраще відповідає наявним даним; вона покаже тенденцію. Для цього слід використовувати клас OLS. Незабаром ми дізнаємося, як додати більше ознак, що покращить прогнозування!
Swipe to start coding
- Призначте стовпець
'price'зdfзміннійy. - Створіть матрицю
X_tildeза допомогою функціїadd_constant()з пакетуstatsmodels(імпортовано якsm). - Ініціалізуйте об'єкт
OLSта навчіть його. - Попередньо обробіть масив
X_newтак само, як іX. - Здійсніть прогноз цільової змінної для матриці
X_new_tilde.
Рішення
Дякуємо за ваш відгук!
single