Моделі
Свайпніть щоб показати меню
Основи попередньої обробки даних і побудови конвеєрів вже розглянуто. Наступний етап — моделювання.
Модель у Scikit-learn — це оцінювач (estimator), який надає методи .predict() і .score(), а також успадковує .fit() від усіх оцінювачів.
.fit()
Після попередньої обробки даних і підготовки їх до моделі першим кроком побудови моделі є навчання моделі. Це виконується за допомогою .fit(X, y).
Для контрольованого навчання (регресія, класифікація) .fit() вимагає як X, так і y.
Для неконтрольованого навчання (наприклад, кластеризація) викликається лише .fit(X). Передача y не викликає помилки — цей параметр просто ігнорується.
Під час навчання модель вивчає закономірності, необхідні для прогнозування. Те, що саме вивчається, і тривалість навчання залежать від алгоритму. Навчання часто є найповільнішою частиною машинного навчання, особливо при роботі з великими наборами даних.
.predict()
Після навчання використовуйте .predict() для отримання прогнозів:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() оцінює навчальну модель, зазвичай на тестовій вибірці:
model.fit(X, y)
model.score(X_test, y_test)
Порівнює прогнози з реальними цільовими значеннями. За замовчуванням метрика — точність для класифікації.
X_test позначає підмножину датасету, відому як тестова вибірка, яка використовується для оцінки ефективності моделі після навчання. Вона містить ознаки (вхідні дані). y_test — це відповідна підмножина істинних міток для X_test. Разом вони дозволяють оцінити, наскільки добре модель прогнозує нові, невідомі дані.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат