Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Utmaning: Sätta Ihop Allt | Modellering
Introduktion till ML med Scikit-learn

bookUtmaning: Sätta Ihop Allt

I denna utmaning tillämpar du hela arbetsflödet som du har lärt dig i kursen — från datapreprocessering till träning och modelevaluering.

Uppgift

Swipe to start coding

Du arbetar med en dataset av pingviner. Ditt mål är att bygga en komplett maskininlärningspipeline som klassificerar pingvinarter med hjälp av en K-Nearest Neighbors (KNN)-modell. Pipelinen ska hantera kategorisk kodning, saknade värden, skalning av variabler och parameteroptimering.

  1. Koda målvariabeln y med hjälp av klassen LabelEncoder.
  2. Dela upp datasetet i tränings- och testmängder med train_test_split() och test_size=0.33.
  3. Skapa en ColumnTransformer med namnet ct som applicerar en OneHotEncoder på kolumnerna 'island' och 'sex', och lämnar övriga kolumner oförändrade (remainder='passthrough').
  4. Definiera ett parameternät param_grid som innehåller följande värden för n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25], samt inkluderar 'weights' ('uniform', 'distance') och 'p' (1, 2).
  5. Skapa ett GridSearchCV-objekt med KNeighborsClassifier() som estimator och param_grid som parameternät.
  6. Bygg en pipeline som inkluderar följande steg i ordning:
  • ColumnTransformer (ct);
  • En SimpleImputer med strategin satt till 'most_frequent';
  • En StandardScaler för skalning av variabler;
    • GridSearchCV-objektet som sista steg.
  1. Träna pipelinen på träningsdatan (X_train, y_train) med .fit()-metoden.
  2. Utvärdera modellens prestanda genom att skriva ut testresultatet med .score(X_test, y_test).
  3. Generera prediktioner på testdatan och skriv ut de första 5 avkodade klassnamnen med label_enc.inverse_transform().
  4. Skriv ut den bästa estimatorn som hittats av GridSearchCV med attributet .best_estimator_.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 10
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

close

Awesome!

Completion rate improved to 3.13

bookUtmaning: Sätta Ihop Allt

Svep för att visa menyn

I denna utmaning tillämpar du hela arbetsflödet som du har lärt dig i kursen — från datapreprocessering till träning och modelevaluering.

Uppgift

Swipe to start coding

Du arbetar med en dataset av pingviner. Ditt mål är att bygga en komplett maskininlärningspipeline som klassificerar pingvinarter med hjälp av en K-Nearest Neighbors (KNN)-modell. Pipelinen ska hantera kategorisk kodning, saknade värden, skalning av variabler och parameteroptimering.

  1. Koda målvariabeln y med hjälp av klassen LabelEncoder.
  2. Dela upp datasetet i tränings- och testmängder med train_test_split() och test_size=0.33.
  3. Skapa en ColumnTransformer med namnet ct som applicerar en OneHotEncoder på kolumnerna 'island' och 'sex', och lämnar övriga kolumner oförändrade (remainder='passthrough').
  4. Definiera ett parameternät param_grid som innehåller följande värden för n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25], samt inkluderar 'weights' ('uniform', 'distance') och 'p' (1, 2).
  5. Skapa ett GridSearchCV-objekt med KNeighborsClassifier() som estimator och param_grid som parameternät.
  6. Bygg en pipeline som inkluderar följande steg i ordning:
  • ColumnTransformer (ct);
  • En SimpleImputer med strategin satt till 'most_frequent';
  • En StandardScaler för skalning av variabler;
    • GridSearchCV-objektet som sista steg.
  1. Träna pipelinen på träningsdatan (X_train, y_train) med .fit()-metoden.
  2. Utvärdera modellens prestanda genom att skriva ut testresultatet med .score(X_test, y_test).
  3. Generera prediktioner på testdatan och skriv ut de första 5 avkodade klassnamnen med label_enc.inverse_transform().
  4. Skriv ut den bästa estimatorn som hittats av GridSearchCV med attributet .best_estimator_.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 10
single

single

some-alt