Udfordring: At Samle Det Hele
I denne udfordring anvendes hele arbejdsgangen, der er lært i kurset — fra datapreprocessering over træning til modelevaluering.
Swipe to start coding
Du får et datasæt med pingviner. Dit mål er at opbygge en maskinlæringspipeline, der klassificerer pingvinarter ved hjælp af en K-Nearest Neighbors (KNN)-model, samtidig med at du håndterer kodning, manglende værdier og parameteroptimering korrekt.
- Kod målvariablen ved hjælp af
LabelEncoder. - Opdel datasættet i trænings- og testdatasæt med
test_size=0.33. - Opret en ColumnTransformer (
ct), der kun koder kolonnerne'island'og'sex'med en passende encoder til nominale data (OneHotEncoder) og lader de øvrige kolonner være uændrede. - Definér et parametergrid (
param_grid), der inkluderer følgende værdier forn_neighbors:[1, 3, 5, 7, 9, 12, 15, 20, 25]. - Opret et
GridSearchCV-objekt medKNeighborsClassifiersom grundmodel ogparam_gridsom dets parametre. - Byg en pipeline bestående af:
ColumnTransformer(ct);- en
SimpleImputer(strategi ='most_frequent'); - en
StandardScaler; - og
GridSearchCVsom sidste trin.
- Træn pipelinen ved hjælp af træningsdataene (
X_train,y_train). - Evaluer modellen på testdataene ved at udskrive dens
.score(X_test, y_test). - Forudsig på testdatasættet og udskriv de første 5 dekodede forudsigelser ved hjælp af
label_enc.inverse_transform(). - Til sidst udskrives den bedste estimator, som
GridSearchCVhar fundet.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 3.13
Udfordring: At Samle Det Hele
Stryg for at vise menuen
I denne udfordring anvendes hele arbejdsgangen, der er lært i kurset — fra datapreprocessering over træning til modelevaluering.
Swipe to start coding
Du får et datasæt med pingviner. Dit mål er at opbygge en maskinlæringspipeline, der klassificerer pingvinarter ved hjælp af en K-Nearest Neighbors (KNN)-model, samtidig med at du håndterer kodning, manglende værdier og parameteroptimering korrekt.
- Kod målvariablen ved hjælp af
LabelEncoder. - Opdel datasættet i trænings- og testdatasæt med
test_size=0.33. - Opret en ColumnTransformer (
ct), der kun koder kolonnerne'island'og'sex'med en passende encoder til nominale data (OneHotEncoder) og lader de øvrige kolonner være uændrede. - Definér et parametergrid (
param_grid), der inkluderer følgende værdier forn_neighbors:[1, 3, 5, 7, 9, 12, 15, 20, 25]. - Opret et
GridSearchCV-objekt medKNeighborsClassifiersom grundmodel ogparam_gridsom dets parametre. - Byg en pipeline bestående af:
ColumnTransformer(ct);- en
SimpleImputer(strategi ='most_frequent'); - en
StandardScaler; - og
GridSearchCVsom sidste trin.
- Træn pipelinen ved hjælp af træningsdataene (
X_train,y_train). - Evaluer modellen på testdataene ved at udskrive dens
.score(X_test, y_test). - Forudsig på testdatasættet og udskriv de første 5 dekodede forudsigelser ved hjælp af
label_enc.inverse_transform(). - Til sidst udskrives den bedste estimator, som
GridSearchCVhar fundet.
Løsning
Tak for dine kommentarer!
single