Summary  
This chapter explains scikit-learn’s core API objects—estimators (with fit), transformers (fit/transform), predictors (predict), and models (score)—and how they fit into a data preprocessing and modeling workflow.  

General domain of usage  
Machine learning pipelines

Biblioteket **scikit-learn** (`sklearn`) tilbyder værktøjer til forbehandling og modellering. Dets primære objekttyper er **estimator**, **transformer**, **predictor** og **model**.

## Estimator

Enhver klasse med `.fit()` er en estimator — den **lærer fra data**.

```python
estimator.fit(X, y)     # supervised  
estimator.fit(X)        # unsupervised
```

## Transformer

En transformer har `.fit()` og `.transform()`, samt `.fit_transform()` til at udføre begge på én gang.

Transformere bruges normalt til at transformere `X`-arrayet. Som vi vil se i eksemplet med `LabelEncoder`, er nogle transformere dog lavet til `y`-arrayet.

Bemærk

`nan`-værdier vist i træningssættet på billedet angiver manglende data i Python.

## Predictor

En predictor er en estimator med `.predict()` til generering af output.

```python
predictor.fit(X, y)
predictor.predict(X_new)
```

## Model

En model er en forudsigelsesmaskine med `.score()`, som evaluerer ydeevne.

```python
model.fit(X, y)
model.score(X, y)
```

Som nævnt i det forrige kapitel er **nøjagtighed** en måling, der repræsenterer procentdelen af korrekte forudsigelser.

`.fit()`, `.transform()`, `.fit_transform()`

**Forbehandling** involverer arbejde med transformere, og vi arbejder med prediktorer (mere specifikt med modeller) i **modellering**-fasen.

Maskinlæring anvendes nu overalt. Vil du lære det selv? Dette kursus er en introduktion til maskinlæringens verden, hvor du lærer grundlæggende begreber, arbejder med Scikit-learn – det mest populære bibliotek til ML – og bygger dit første maskinlæringsprojekt.
Dette kursus er tiltænkt studerende med grundlæggende kendskab til Python, Pandas og Numpy.

Lær om maskinlæringskoncepter og arbejdsgangen i et ML-projekt.

Forbehandling er sandsynligvis den vigtigste fase i et ML-projekt. Dette kapitel dækker de forbehandlingsskridt, der er nødvendige for næsten ethvert datasæt.

En pipeline er en elegant måde at kombinere alle forbehandlingsskridt samt en model. Pipelines gør det meget nemmere at træne og anvende en model.

Modellering er den mest underholdende fase i et ML-projekt. Lad os lære at opbygge, finjustere og evaluere modellen!

Scikit-learn-Koncepter

Estimator

Transformer

Predictor

Model