Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: Sette Alt Sammen | Modellering
Introduksjon til ML med Scikit-learn

bookUtfordring: Sette Alt Sammen

I denne utfordringen skal du anvende hele arbeidsflyten du har lært i kurset — fra dataprosessering via trening til modelevaluering.

Oppgave

Swipe to start coding

Du arbeider med et datasett over pingviner. Målet ditt er å bygge en komplett maskinlærings-pipeline som klassifiserer pingvinarter ved hjelp av en K-Nearest Neighbors (KNN)-modell. Pipelinen skal håndtere kategorisk koding, manglende verdier, skalering av variabler og parameterjustering.

  1. Kode målvariabelen y ved å bruke klassen LabelEncoder.
  2. Del datasettet i trenings- og testsett med train_test_split() og test_size=0.33.
  3. Lag en ColumnTransformer kalt ct som bruker en OneHotEncoder på kolonnene 'island' og 'sex', og lar alle andre kolonner være uendret (remainder='passthrough').
  4. Definer et parametergrid param_grid som inneholder følgende verdier for n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25], og inkluder 'weights' ('uniform', 'distance') og 'p' (1, 2).
  5. Lag et GridSearchCV-objekt med KNeighborsClassifier() som estimator og param_grid som parametergrid.
  6. Bygg en pipeline som inkluderer følgende steg i rekkefølge:
  • ColumnTransformer (ct);
  • En SimpleImputer med strategi satt til 'most_frequent';
  • En StandardScaler for skalering av variabler;
    • GridSearchCV-objektet som siste steg.
  1. Tren pipelinen på treningsdataene (X_train, y_train) ved å bruke .fit()-metoden.
  2. Evaluer modellens ytelse ved å skrive ut testscoren med .score(X_test, y_test).
  3. Generer prediksjoner på testdataene og skriv ut de første 5 dekodede klassenavnene ved å bruke label_enc.inverse_transform().
  4. Skriv ut den beste estimatoren funnet av GridSearchCV ved å bruke attributtet .best_estimator_.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 10
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

close

Awesome!

Completion rate improved to 3.13

bookUtfordring: Sette Alt Sammen

Sveip for å vise menyen

I denne utfordringen skal du anvende hele arbeidsflyten du har lært i kurset — fra dataprosessering via trening til modelevaluering.

Oppgave

Swipe to start coding

Du arbeider med et datasett over pingviner. Målet ditt er å bygge en komplett maskinlærings-pipeline som klassifiserer pingvinarter ved hjelp av en K-Nearest Neighbors (KNN)-modell. Pipelinen skal håndtere kategorisk koding, manglende verdier, skalering av variabler og parameterjustering.

  1. Kode målvariabelen y ved å bruke klassen LabelEncoder.
  2. Del datasettet i trenings- og testsett med train_test_split() og test_size=0.33.
  3. Lag en ColumnTransformer kalt ct som bruker en OneHotEncoder på kolonnene 'island' og 'sex', og lar alle andre kolonner være uendret (remainder='passthrough').
  4. Definer et parametergrid param_grid som inneholder følgende verdier for n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25], og inkluder 'weights' ('uniform', 'distance') og 'p' (1, 2).
  5. Lag et GridSearchCV-objekt med KNeighborsClassifier() som estimator og param_grid som parametergrid.
  6. Bygg en pipeline som inkluderer følgende steg i rekkefølge:
  • ColumnTransformer (ct);
  • En SimpleImputer med strategi satt til 'most_frequent';
  • En StandardScaler for skalering av variabler;
    • GridSearchCV-objektet som siste steg.
  1. Tren pipelinen på treningsdataene (X_train, y_train) ved å bruke .fit()-metoden.
  2. Evaluer modellens ytelse ved å skrive ut testscoren med .score(X_test, y_test).
  3. Generer prediksjoner på testdataene og skriv ut de første 5 dekodede klassenavnene ved å bruke label_enc.inverse_transform().
  4. Skriv ut den beste estimatoren funnet av GridSearchCV ved å bruke attributtet .best_estimator_.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 10
single

single

some-alt