Modeling Summary
Stryg for at vise menuen
Du ved nu, hvordan man opbygger en model, bruger pipelines og justerer hyperparametre. Du har også lært to evalueringsmetoder: train-test split og krydsvalidering.
Næste skridt er at kombinere evaluering og tuning ved hjælp af GridSearchCV eller RandomizedSearchCV.
Da vores datasæt er meget lille, vil vi bruge GridSearchCV, men alt nedenstående gælder også for en RandomizedSearchCV.
Da krydsvalidering er mere stabil end et enkelt train-test split, er målet at opnå den højeste krydsvalideringsscore.
GridSearchCV søger blandt hyperparametre og finder dem, der maksimerer denne score. Den bedste score gemmes i .best_score_.
Hyperparametre, der fungerer bedst for ét datasæt, generaliserer muligvis ikke, når nye data tilføjes.
Derfor kan .best_score_ være højere end modellens præstation på helt usete data.
En almindelig arbejdsgang: opdel i trænings- og testdatasæt; udfør krydsvalidering på træningsdatasættet for at justere modellen; evaluer derefter den optimerede model på testdatasættet for at måle præstation i virkeligheden.
For at opsummere:
- Forbehandling af data;
- Opdeling i trænings- og testdatasæt;
- Brug af krydsvalidering på træningsdatasættet for at finde den bedste konfiguration;
- Evaluering på testdatasættet.
Det tredje trin indebærer normalt afprøvning af flere algoritmer og justering af deres hyperparametre for at identificere den bedste mulighed. For enkelhedens skyld blev kun én algoritme anvendt i dette kursus.
Krydsvalidering er ikke altid den bedste løsning. For store datasæt bliver beregning af CV-scorer dyrt, mens en trænings-test-opdeling bliver mere stabil takket være det store testdatasæt.
Store datasæt opdeles ofte i træningssæt, valideringssæt og test-sæt. Hyperparametre vælges baseret på præstationen på valideringssættet. Til sidst evalueres den valgte model på test-sættet for at verificere, hvor godt den generaliserer.
Penguins dataset er lille med kun 342 eksempler. På grund af denne begrænsede størrelse vil krydsvalideringsscoren blive brugt til evaluering i næste kapitel.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat