Summary  
This chapter explains how to use an estimator’s `.fit()`, `.predict()`, and `.score()` methods to train a model, generate predictions, and evaluate its performance.  

General domain of usage  
Supervised machine learning

Grunderna i datapreprocessering och konstruktion av pipelines har nu behandlats. Nästa steg är **modellering**.


En **modell** i Scikit-learn är en **estimator** som tillhandahåller metoderna `.predict()` och `.score()`, samt `.fit()` som ärvs från alla estimatorer.


## .fit() 

När data har förbehandlats och är redo att användas i modellen, är det första steget i att bygga en modell **träning av en modell**. Detta görs med hjälp av `.fit(X, y)`.

För **övervakad inlärning** (regression, klassificering) kräver `.fit()` både `X` och `y`.
För **oövervakad inlärning** (t.ex. klustring) anropar du endast `.fit(X)`. Att skicka med `y` orsakar inget fel — det ignoreras helt enkelt.

Notering

Under träningen **lär sig** modellen mönster som behövs för prediktion. Vad den lär sig och hur lång tid träningen tar beror på algoritmen. Träning är ofta den **långsammaste delen** av maskininlärning, särskilt med stora datamängder.

## .predict()

Efter träning används `.predict()` för att generera förutsägelser:

```python
model.fit(X, y)
y_pred = model.predict(X_new)
```

## .score()

`.score()` utvärderar en tränad modell, vanligtvis på en **testuppsättning**:

```python
model.fit(X, y)
model.score(X_test, y_test)
```

Den jämför förutsägelser med verkliga mål. Som standard är måttet **noggrannhet** för klassificering.

`X_test` avser den delmängd av datasetet, kallad **testuppsättningen**, som används för att utvärdera en modells prestanda efter träning. Den innehåller **funktioner** (inmatningsdata). `y_test` är den motsvarande delmängden av **sanna etiketter** för `X_test`. Tillsammans bedömer de hur väl modellen förutsäger ny, osedd data.

Maskininlärning används nu överallt. Vill du lära dig det själv? Denna kurs är en introduktion till maskininlärningens värld där du får lära dig grundläggande begrepp, arbeta med scikit-learn – det mest populära biblioteket för ML, och bygga ditt första maskininlärningsprojekt.
Kursen är avsedd för studenter med grundläggande kunskaper i Python, Pandas och Numpy.

Lär dig maskininlärningskoncept och arbetsflödet för ML-projekt.

Förbehandling är troligen det viktigaste steget i ett ML-projekt. Detta kapitel behandlar de förbehandlingssteg som krävs för nästan alla datamängder.

En pipeline är ett smidigt sätt att kombinera alla förbehandlingssteg samt en modell. Pipelines gör det mycket enklare att träna och använda en modell.

Modellering är det mest underhållande steget i ett ML-projekt. Lär dig att bygga, finjustera och utvärdera modellen!