Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Samle Det Hele | Modellering
ML Introduktion med Scikit-learn

bookUdfordring: Samle Det Hele

I denne udfordring anvendes hele arbejdsgangen, der er gennemgået i kurset — fra datapræprocessering over træning til modelevaluering.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Opgave

Swipe to start coding

  1. Kodér målet.
  2. Opdel dataene, så 33% bruges til testdatasættet og resten til træningsdatasættet.
  3. Opret en ColumnTransformer til kun at kode kolonnerne 'island' og 'sex'. Sørg for, at de andre kolonner forbliver uændrede. Brug en passende encoder til nominelle data.
  4. Udfyld hullerne i en param_grid for at afprøve følgende værdier for antallet af naboer: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Opret et GridSearchCV-objekt med KNeighborsClassifier som model.
  6. Konstruér en pipeline, der starter med ct som første trin, efterfulgt af imputation med den mest hyppige værdi, standardisering, og afsluttes med GridSearchCV som sidste estimator.
  7. Træn modellen ved hjælp af en pipeline på træningssættet.
  8. Evaluer modellen på testdatasættet. (Udskriv dens score)
  9. Få et forudsagt mål for X_test.
  10. Udskriv den bedste estimator fundet af grid_search.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 10
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you provide the dataset we'll be working with?

What type of model should I use for this challenge?

Could you outline the specific steps involved in the workflow?

close

Awesome!

Completion rate improved to 3.13

bookUdfordring: Samle Det Hele

Stryg for at vise menuen

I denne udfordring anvendes hele arbejdsgangen, der er gennemgået i kurset — fra datapræprocessering over træning til modelevaluering.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Opgave

Swipe to start coding

  1. Kodér målet.
  2. Opdel dataene, så 33% bruges til testdatasættet og resten til træningsdatasættet.
  3. Opret en ColumnTransformer til kun at kode kolonnerne 'island' og 'sex'. Sørg for, at de andre kolonner forbliver uændrede. Brug en passende encoder til nominelle data.
  4. Udfyld hullerne i en param_grid for at afprøve følgende værdier for antallet af naboer: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Opret et GridSearchCV-objekt med KNeighborsClassifier som model.
  6. Konstruér en pipeline, der starter med ct som første trin, efterfulgt af imputation med den mest hyppige værdi, standardisering, og afsluttes med GridSearchCV som sidste estimator.
  7. Træn modellen ved hjælp af en pipeline på træningssættet.
  8. Evaluer modellen på testdatasættet. (Udskriv dens score)
  9. Få et forudsagt mål for X_test.
  10. Udskriv den bedste estimator fundet af grid_search.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

close

Awesome!

Completion rate improved to 3.13
Sektion 4. Kapitel 10
single

single

some-alt