Summary  
This chapter explains scikit-learn’s core API objects—estimators (with fit), transformers (fit/transform), predictors (predict), and models (score)—and how they fit into a data preprocessing and modeling workflow.  

General domain of usage  
Machine learning pipelines

De **scikit-learn** (`sklearn`) bibliotheek biedt hulpmiddelen voor preprocessing en modellering. De belangrijkste objecttypen zijn **estimator**, **transformer**, **predictor** en **model**.

## Estimator

Elke klasse met `.fit()` is een estimator — deze **leert van data**.

```python
estimator.fit(X, y)     # supervised  
estimator.fit(X)        # unsupervised
```

## Transformer

Een transformer heeft `.fit()` en `.transform()`, plus `.fit_transform()` om beide tegelijk uit te voeren.

Transformers worden meestal gebruikt om de `X`-array te transformeren. Zoals we zullen zien in het voorbeeld van `LabelEncoder`, zijn sommige transformers echter bedoeld voor de `y`-array.

Opmerking

`nan`-waarden die in de trainingsset op de afbeelding worden weergegeven, duiden op ontbrekende gegevens in Python.

## Predictor

Een predictor is een schatter met `.predict()` voor het genereren van uitkomsten.

```python
predictor.fit(X, y)
predictor.predict(X_new)
```

## Model

Een model is een voorspeller met `.score()`, die de prestaties evalueert.

```python
model.fit(X, y)
model.score(X, y)
```

Zoals vermeld in het vorige hoofdstuk, is **nauwkeurigheid** een maatstaf die het percentage correcte voorspellingen weergeeft.

`.fit()`, `.transform()`, `.fit_transform()`

De **preprocessing**-fase omvat het werken met transformers, en we werken met predictors (meer specifiek met modellen) in de **modelleer**-fase.

Machine learning wordt tegenwoordig overal toegepast. Wil je het zelf leren? Deze cursus is een introductie tot de wereld van machine learning waarin je basisconcepten leert, werkt met Scikit-learn – de populairste bibliotheek voor ML – en je eerste machine learning-project bouwt.
Deze cursus is bedoeld voor studenten met basiskennis van Python, Pandas en Numpy.

Leer de concepten van machine learning en de workflow van een ML-project.

Preprocessing is waarschijnlijk de belangrijkste fase van een ML-project. Dit hoofdstuk behandelt de preprocessing-stappen die nodig zijn voor vrijwel elke dataset.

Een pipeline is een overzichtelijke manier om alle preprocessingsstappen en een model te combineren. Pipelines maken het veel eenvoudiger om een model te trainen en te gebruiken.

Modellering is de meest interessante fase van een ML-project. Leer het model opbouwen, verfijnen en evalueren!

Scikit-learn-Concepten

Estimator

Transformer

Predictor

Model