Udfordring: Samle Det Hele
I denne udfordring anvendes hele arbejdsgangen, der er gennemgået i kurset — fra datapræprocessering over træning til modelevaluering.





Opgave
Swipe to start coding
- Kodér målet.
- Opdel dataene, så 33% bruges til testdatasættet og resten til træningsdatasættet.
- Opret en
ColumnTransformer
til kun at kode kolonnerne'island'
og'sex'
. Sørg for, at de andre kolonner forbliver uændrede. Brug en passende encoder til nominelle data. - Udfyld hullerne i en
param_grid
for at afprøve følgende værdier for antallet af naboer:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Opret et
GridSearchCV
-objekt medKNeighborsClassifier
som model. - Konstruér en pipeline, der starter med
ct
som første trin, efterfulgt af imputation med den mest hyppige værdi, standardisering, og afsluttes medGridSearchCV
som sidste estimator. - Træn modellen ved hjælp af en pipeline på træningssættet.
- Evaluer modellen på testdatasættet. (Udskriv dens score)
- Få et forudsagt mål for
X_test
. - Udskriv den bedste estimator fundet af
grid_search
.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 4. Kapitel 10
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Suggested prompts:
Can you provide the dataset we'll be working with?
What type of model should I use for this challenge?
Could you outline the specific steps involved in the workflow?
Awesome!
Completion rate improved to 3.13
Udfordring: Samle Det Hele
Stryg for at vise menuen
I denne udfordring anvendes hele arbejdsgangen, der er gennemgået i kurset — fra datapræprocessering over træning til modelevaluering.





Opgave
Swipe to start coding
- Kodér målet.
- Opdel dataene, så 33% bruges til testdatasættet og resten til træningsdatasættet.
- Opret en
ColumnTransformer
til kun at kode kolonnerne'island'
og'sex'
. Sørg for, at de andre kolonner forbliver uændrede. Brug en passende encoder til nominelle data. - Udfyld hullerne i en
param_grid
for at afprøve følgende værdier for antallet af naboer:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Opret et
GridSearchCV
-objekt medKNeighborsClassifier
som model. - Konstruér en pipeline, der starter med
ct
som første trin, efterfulgt af imputation med den mest hyppige værdi, standardisering, og afsluttes medGridSearchCV
som sidste estimator. - Træn modellen ved hjælp af en pipeline på træningssættet.
- Evaluer modellen på testdatasættet. (Udskriv dens score)
- Få et forudsagt mål for
X_test
. - Udskriv den bedste estimator fundet af
grid_search
.
Løsning
Var alt klart?
Tak for dine kommentarer!
Awesome!
Completion rate improved to 3.13Sektion 4. Kapitel 10
single