Sektion 4. Kapitel 10
single
Udfordring: Samle Det Hele
Stryg for at vise menuen
I denne udfordring skal du anvende hele arbejdsgangen, du har lært i kurset — fra datapreprocessering over træning til modelevaluering.
Opgave
Swipe to start coding
Du arbejder med et pingvindatasæt. Byg en ML-pipeline til at klassificere arter med KNN, hvor du håndterer kodning, manglende værdier, skalering og tuning.
- Kod
ymedLabelEncoder. - Opdel med
train_test_split(test_size=0.33). - Opret
ct:OneHotEncoderpå'island','sex',remainder='passthrough'. - Angiv
param_gridforn_neighbors,weights,p. Forn_neighborser det bedst at bruge ulige heltal. - Opret
GridSearchCV(KNeighborsClassifier(), param_grid). - Pipeline:
ct→SimpleImputer('most_frequent')→StandardScaler→GridSearchCV. - Fit på træningsdata.
- Udskriv test
.score. - Forudsig, udskriv de første 5 dekodede etiketter.
- Udskriv
.best_estimator_.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 4. Kapitel 10
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat