Sectie 4. Hoofdstuk 10
single
Uitdaging: Alles Samenbrengen
Veeg om het menu te tonen
In deze uitdaging wordt de volledige workflow toegepast die in de cursus is geleerd — van gegevensvoorbewerking tot training en modelbeoordeling.
Taak
Veeg om te beginnen met coderen
Je werkt met een pinguïn-dataset. Bouw een ML-pijplijn om soorten te classificeren met KNN, waarbij codering, ontbrekende waarden, schalen en tuning worden afgehandeld.
- Codeer
ymetLabelEncoder. - Splits met
train_test_split(test_size=0.33). - Maak
ct:OneHotEncoderop'island','sex',remainder='passthrough'. - Stel
param_gridin voorn_neighbors,weights,p. Voorn_neighborsis het beter om oneven gehele waarden te gebruiken. - Maak
GridSearchCV(KNeighborsClassifier(), param_grid). - Pijplijn:
ct→SimpleImputer('most_frequent')→StandardScaler→GridSearchCV. - Fit op de trainingsset.
- Print de
.scoreop de testset. - Voorspel, print de eerste 5 gedecodeerde labels.
- Print
.best_estimator_.
Oplossing
Was alles duidelijk?
Bedankt voor je feedback!
Sectie 4. Hoofdstuk 10
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.