Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Utmaning: Sätta Ihop Allt | Modellering
ML-introduktion Med Scikit-learn

bookUtmaning: Sätta Ihop Allt

I denna utmaning tillämpas hela arbetsflödet som lärts ut i kursen — från datapreprocessering till träning och modelevaluering.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Uppgift

Swipe to start coding

Du har fått en dataset med pingviner. Ditt mål är att bygga en maskininlärningspipeline som klassificerar pingvinarter med hjälp av en K-Nearest Neighbors (KNN)-modell, samtidigt som du hanterar kodning, saknade värden och parameteroptimering på rätt sätt.

  1. Koda målvariabeln med LabelEncoder.
  2. Dela upp datasetet i tränings- och testdata med test_size=0.33.
  3. Skapa en ColumnTransformer (ct) som endast kodar kolumnerna 'island' och 'sex' med en lämplig kodare för nominaldata (OneHotEncoder) och lämnar övriga kolumner oförändrade.
  4. Definiera ett parameterraster (param_grid) som inkluderar följande värden för n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Skapa ett GridSearchCV-objekt med KNeighborsClassifier som basmodell och param_grid som dess parametrar.
  6. Bygg en pipeline bestående av:
  • ColumnTransformer (ct);
  • en SimpleImputer (strategi = 'most_frequent');
  • en StandardScaler;
  • och GridSearchCV som sista steg.
  1. Träna pipelinen med träningsdata (X_train, y_train).
  2. Utvärdera modellen på testdata genom att skriva ut dess .score(X_test, y_test).
  3. Förutsäg på testmängden och skriv ut de första 5 avkodade förutsägelserna med label_enc.inverse_transform().
  4. Skriv slutligen ut den bästa estimatormodellen som hittats av GridSearchCV.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 10
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Suggested prompts:

Can you provide the dataset we'll be working with?

What type of model should I use for this challenge?

Could you outline the specific steps involved in the workflow?

close

Awesome!

Completion rate improved to 3.13

bookUtmaning: Sätta Ihop Allt

Svep för att visa menyn

I denna utmaning tillämpas hela arbetsflödet som lärts ut i kursen — från datapreprocessering till träning och modelevaluering.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Uppgift

Swipe to start coding

Du har fått en dataset med pingviner. Ditt mål är att bygga en maskininlärningspipeline som klassificerar pingvinarter med hjälp av en K-Nearest Neighbors (KNN)-modell, samtidigt som du hanterar kodning, saknade värden och parameteroptimering på rätt sätt.

  1. Koda målvariabeln med LabelEncoder.
  2. Dela upp datasetet i tränings- och testdata med test_size=0.33.
  3. Skapa en ColumnTransformer (ct) som endast kodar kolumnerna 'island' och 'sex' med en lämplig kodare för nominaldata (OneHotEncoder) och lämnar övriga kolumner oförändrade.
  4. Definiera ett parameterraster (param_grid) som inkluderar följande värden för n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Skapa ett GridSearchCV-objekt med KNeighborsClassifier som basmodell och param_grid som dess parametrar.
  6. Bygg en pipeline bestående av:
  • ColumnTransformer (ct);
  • en SimpleImputer (strategi = 'most_frequent');
  • en StandardScaler;
  • och GridSearchCV som sista steg.
  1. Träna pipelinen med träningsdata (X_train, y_train).
  2. Utvärdera modellen på testdata genom att skriva ut dess .score(X_test, y_test).
  3. Förutsäg på testmängden och skriv ut de första 5 avkodade förutsägelserna med label_enc.inverse_transform().
  4. Skriv slutligen ut den bästa estimatormodellen som hittats av GridSearchCV.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 10
single

single

some-alt