Summary  
This chapter covers hyperparameter tuning and model evaluation using cross-validation combined with GridSearchCV or RandomizedSearchCV, along with best practices for splitting data into training, validation, and test sets.  

General domain of usage  
Supervised machine learning model selection and evaluation

Du vet nå hvordan du bygger en **modell**, bruker **pipelines** og justerer **hyperparametere**. Du har også lært to evalueringsmetoder: train-test split og kryssvalidering.
Neste steg er å kombinere evaluering og tuning ved å bruke `GridSearchCV` eller `RandomizedSearchCV`.

Siden datasettet vårt er lite, vil vi bruke `GridSearchCV`, men alt som sies nedenfor gjelder også for en `RandomizedSearchCV`.

Merk

Siden kryssvalidering er mer stabilt enn en enkel train-test split, er målet å oppnå **høyest mulig kryssvalideringsscore**.
`GridSearchCV` søker gjennom hyperparametere og finner de som maksimerer denne scoren. Den beste scoren lagres i `.best_score_`.

Hyperparametere som fungerer best for ett datasett, kan **ikke generaliseres** når nye data kommer inn.
Dermed kan `.best_score_` være høyere enn modellens ytelse på **helt ukjente** data.

En vanlig arbeidsflyt: del opp i trenings- og testsett; kjør kryssvalidering på **treningssettet** for å justere modellen; evaluer deretter den optimaliserte modellen på **testsettet** for å måle ytelse i virkelige situasjoner.

Oppsummert:

1. Forbehandle dataene;
2. Del opp i trenings- og testsett;
3. Bruk kryssvalidering på treningssettet for å finne den beste konfigurasjonen;
4. Evaluer på testsettet.

Det tredje steget innebærer vanligvis å teste **flere algoritmer** og justere deres hyperparametre for å identifisere det beste alternativet. For enkelhets skyld ble kun én algoritme brukt i dette kurset.


Les mer

Kryssvalidering er ikke alltid det beste alternativet. For store datasett blir beregning av CV-score kostbart, mens et trenings- og testsett gir mer stabile resultater takket være et stort testsett.

Store datasett deles ofte inn i **treningssett**, **valideringssett** og **testsett**.
Hyperparametre velges basert på ytelsen på **valideringssettet**.
Til slutt evalueres den valgte modellen på **testsettet** for å verifisere hvor godt den generaliserer.

**Penguins-datasettet** er lite, med kun 342 forekomster. På grunn av denne begrensede størrelsen vil kryssvalideringsscore bli brukt til evaluering i neste kapittel.


Hvorfor er kryssvalidering spesielt verdifull for hyperparameterjustering i mindre datasett, i motsetning til større datasett hvor trenings- og testdelinger ofte foretrekkes?

Maskinlæring brukes nå overalt. Vil du lære det selv? Dette kurset er en introduksjon til maskinlæring hvor du lærer grunnleggende konsepter, arbeider med Scikit-learn – det mest populære biblioteket for ML, og bygger ditt første maskinlæringsprosjekt.
Kurset er beregnet på studenter med grunnleggende kunnskaper i Python, Pandas og Numpy.

Lær om maskinlæringskonsepter og arbeidsflyten i et ML-prosjekt.

Forbehandling er sannsynligvis den viktigste fasen i et ML-prosjekt. Dette kapittelet dekker forbehandlingsstegene som trengs for nesten alle datasett.

En pipeline er en ryddig måte å kombinere alle forhåndsprosesseringssteg samt en modell. Pipeliner gjør det mye enklere å trene og bruke en modell.

Modellering er den mest spennende fasen i et ML-prosjekt. La oss lære å bygge, finjustere og evaluere modellen!

Oppsummering av Modellering