Summary  
This chapter explains how logistic regression produces linear decision boundaries and how using polynomial feature transformations enables it to capture non-linear relationships and generate more complex decision boundaries.  

General domain of usage  
Machine learning classification tasks

Laten we de resultaten van Logistische Regressie visualiseren. Bekijk het volgende voorbeeld met twee kenmerken:

Na het opstellen van een Logistische Regressie kan een **beslissingsgrens** worden weergegeven. Deze toont het gebied van elke klasse waarin nieuwe instanties als die klasse worden voorspeld. Hier volgt bijvoorbeeld de beslissingsgrens van Logistische Regressie toegepast op bovenstaande gegevens:

Hier is te zien dat de lijn de twee klassen perfect scheidt. In dat geval wordt de dataset **lineair scheidbaar** genoemd. Dit is echter niet altijd het geval. Stel dat de dataset er als volgt uitziet:

Hierboven staat een beslissingsgrens voor een iets andere dataset. Hier zijn de gegevens **niet lineair scheidbaar**; daarom zijn de voorspellingen van Logistische Regressie niet perfect. Helaas kan Logistische Regressie **standaard geen complexere beslissingsgrenzen voorspellen**, dus dit is de beste voorspelling die we kunnen krijgen.
  
Maar onthoud dat Logistische Regressie is afgeleid van Lineaire Regressie, die een oplossing heeft voor het probleem dat het model te eenvoudig is. Deze oplossing is een **Polynomiale Regressie**, en we kunnen de vergelijking hiervan gebruiken om $$z$$ te berekenen en zo een complexere vorm van de beslissingsgrens te verkrijgen:
$$
z = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \beta_3 x_1^2 + \beta_4 x_1 x_2 + \beta_5 x_2^2
$$

Net als bij Polynomiale Regressie kunnen we de `PolynomialFeatures`-transformer gebruiken om polynomiale termen toe te voegen aan onze features - dit helpt het model om complexere patronen te leren.

```python
from sklearn.preprocessing import PolynomialFeatures

X_poly = PolynomialFeatures(2, include_bias=False).fit_transform(X)
```

Deze regel transformeert de oorspronkelijke inputfeatures in `X` door toe te voegen:
- **Kwadratische termen** (bijv. $$x^2$$);
- **Interactietermen** (bijv. $$x_1 \cdot x_2$$ als er meerdere features zijn).

Als `X` bijvoorbeeld oorspronkelijk twee features heeft: $$[x_1, x_2]$$, dan krijg je na het toepassen van `PolynomialFeatures(2, include_bias=False)`: $$[x_1, x_{2}, x_{1}\\^{2}
, x_{1} x_{2}, x_{2}\\^{2}]$$

Hierdoor kunnen modellen zoals **Logistische Regressie** **niet-lineaire relaties** vastleggen en flexibelere, gebogen beslissingsgrenzen produceren. Echter, het verhogen van de graad kan ertoe leiden dat het model te goed past op de trainingsdata - een probleem dat bekend staat als **overfitting**. Daarom proberen we meestal eerst lagere graden en evalueren we het model zorgvuldig.

Waarom heb je polynomiale features nodig bij Logistische Regressie?

Beheers de kernalgoritmen van supervised learning en implementeer deze met Scikit-learn. Verken lineaire en polynomiale regressie voor prijsvoorspelling en maak de overstap naar classificatie met k-NN, Logistische Regressie en Beslissingsbomen. Leer modellen evalueren via cross-validatie, overfitting beheersen met regularisatie en hyperparameters optimaliseren. Bouw robuuste voorspellende systemen en definieer complexe beslissingsgrenzen voor multi-klasse classificatietaken.

Beslissingsgrens