Summary  
This chapter explains how to use an estimator’s `.fit()`, `.predict()`, and `.score()` methods to train a model, generate predictions, and evaluate its performance.  

General domain of usage  
Supervised machine learning

Основи попередньої обробки даних і побудови конвеєрів вже розглянуто. Наступний етап — **моделювання**.


**Модель** у Scikit-learn — це **оцінювач** (estimator), який надає методи `.predict()` і `.score()`, а також успадковує `.fit()` від усіх оцінювачів.


## .fit() 

Після попередньої обробки даних і підготовки їх до моделі першим кроком побудови моделі є **навчання моделі**. Це виконується за допомогою `.fit(X, y)`.

Для **контрольованого навчання** (регресія, класифікація) `.fit()` вимагає як `X`, так і `y`.
Для **неконтрольованого навчання** (наприклад, кластеризація) викликається лише `.fit(X)`. Передача `y` не викликає помилки — цей параметр просто ігнорується.

Примітка

Під час навчання модель **вивчає** закономірності, необхідні для прогнозування. Те, що саме вивчається, і тривалість навчання залежать від алгоритму. Навчання часто є **найповільнішою частиною** машинного навчання, особливо при роботі з великими наборами даних.

## .predict()

Після навчання використовуйте `.predict()` для отримання прогнозів:

```python
model.fit(X, y)
y_pred = model.predict(X_new)
```

## .score()

`.score()` оцінює навчальну модель, зазвичай на **тестовій вибірці**:

```python
model.fit(X, y)
model.score(X_test, y_test)
```

Порівнює прогнози з реальними цільовими значеннями. За замовчуванням метрика — **точність** для класифікації.

`X_test` позначає підмножину датасету, відому як **тестова вибірка**, яка використовується для оцінки ефективності моделі після навчання. Вона містить **ознаки** (вхідні дані). `y_test` — це відповідна підмножина **істинних міток** для `X_test`. Разом вони дозволяють оцінити, наскільки добре модель прогнозує нові, невідомі дані.

Машинне навчання використовується всюди. Бажаєте опанувати його самостійно? Цей курс є вступом у світ машинного навчання, де ви ознайомитеся з базовими поняттями, попрацюєте з Scikit-learn – найпопулярнішою бібліотекою для машинного навчання, та створите свій перший проєкт з машинного навчання.
Курс призначений для студентів з базовими знаннями Python, Pandas та Numpy.

Ознайомлення з концепціями машинного навчання та робочим процесом проєкту ML.

Попередня обробка є, ймовірно, найважливішим етапом проєкту машинного навчання. У цьому розділі розглядаються кроки попередньої обробки, необхідні для майже будь-якого набору даних.

Конвеєр — це зручний спосіб об'єднати всі етапи попередньої обробки та модель. Конвеєри значно спрощують навчання та використання моделі.

Моделювання — це найцікавіший етап проєкту машинного навчання. Дізнаймося, як створювати, налаштовувати та оцінювати модель!

Моделі

.fit()

.predict()

.score()