Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Samle Det Hele | Modellering
ML Introduktion med Scikit-learn

bookUdfordring: Samle Det Hele

I denne udfordring anvendes hele arbejdsgangen, der er gennemgået i kurset — fra datapreprocessering over træning til modelevaluering.

Opgave

Swipe to start coding

Du arbejder med et datasæt over pingviner. Dit mål er at opbygge en komplet maskinlæringspipeline, der klassificerer pingvinarter ved hjælp af en K-Nearest Neighbors (KNN)-model. Pipenlinen skal håndtere kategorisk kodning, manglende værdier, feature-skalering og parameter-tuning.

  1. Kod målvariablen y ved hjælp af klassen LabelEncoder.
  2. Opdel datasættet i trænings- og testdatasæt med train_test_split() og test_size=0.33.
  3. Opret en ColumnTransformer med navnet ct, der anvender en OneHotEncoder på kolonnerne 'island' og 'sex', mens alle andre kolonner forbliver uændrede (remainder='passthrough').
  4. Definér et parameterrum param_grid, der indeholder følgende værdier for n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25], samt inkluderer 'weights' ('uniform', 'distance') og 'p' (1, 2).
  5. Opret et GridSearchCV-objekt med KNeighborsClassifier() som estimator og param_grid som parameterrum.
  6. Byg en pipeline, der indeholder følgende trin i rækkefølge:
  • ColumnTransformer (ct);
  • En SimpleImputer med strategien sat til 'most_frequent';
    • En StandardScaler til feature-skalering;
    • GridSearchCV-objektet som sidste trin.
  1. Træn pipelinen på træningsdataene (X_train, y_train) ved hjælp af .fit()-metoden.
  2. Evaluer modellens præstation ved at udskrive testscoren med .score(X_test, y_test).
  3. Generér forudsigelser på testdataene og udskriv de første 5 dekodede klassenavne ved hjælp af label_enc.inverse_transform().
  4. Udskriv den bedste estimator fundet af GridSearchCV ved hjælp af attributten .best_estimator_.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 10
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

Awesome!

Completion rate improved to 3.13

bookUdfordring: Samle Det Hele

Stryg for at vise menuen

I denne udfordring anvendes hele arbejdsgangen, der er gennemgået i kurset — fra datapreprocessering over træning til modelevaluering.

Opgave

Swipe to start coding

Du arbejder med et datasæt over pingviner. Dit mål er at opbygge en komplet maskinlæringspipeline, der klassificerer pingvinarter ved hjælp af en K-Nearest Neighbors (KNN)-model. Pipenlinen skal håndtere kategorisk kodning, manglende værdier, feature-skalering og parameter-tuning.

  1. Kod målvariablen y ved hjælp af klassen LabelEncoder.
  2. Opdel datasættet i trænings- og testdatasæt med train_test_split() og test_size=0.33.
  3. Opret en ColumnTransformer med navnet ct, der anvender en OneHotEncoder på kolonnerne 'island' og 'sex', mens alle andre kolonner forbliver uændrede (remainder='passthrough').
  4. Definér et parameterrum param_grid, der indeholder følgende værdier for n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25], samt inkluderer 'weights' ('uniform', 'distance') og 'p' (1, 2).
  5. Opret et GridSearchCV-objekt med KNeighborsClassifier() som estimator og param_grid som parameterrum.
  6. Byg en pipeline, der indeholder følgende trin i rækkefølge:
  • ColumnTransformer (ct);
  • En SimpleImputer med strategien sat til 'most_frequent';
    • En StandardScaler til feature-skalering;
    • GridSearchCV-objektet som sidste trin.
  1. Træn pipelinen på træningsdataene (X_train, y_train) ved hjælp af .fit()-metoden.
  2. Evaluer modellens præstation ved at udskrive testscoren med .score(X_test, y_test).
  3. Generér forudsigelser på testdataene og udskriv de første 5 dekodede klassenavne ved hjælp af label_enc.inverse_transform().
  4. Udskriv den bedste estimator fundet af GridSearchCV ved hjælp af attributten .best_estimator_.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 4. Kapitel 10
single

single

some-alt