Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: Sette Alt Sammen | Modellering
ML-Introduksjon med Scikit-learn

bookUtfordring: Sette Alt Sammen

I denne utfordringen skal du anvende hele arbeidsflyten som er gjennomgått i kurset — fra dataprosessering via trening til modelevaluering.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Oppgave

Swipe to start coding

Du får et datasett med pingviner. Målet ditt er å bygge en maskinlærings-pipeline som klassifiserer pingvinarter ved hjelp av en K-Nearest Neighbors (KNN)-modell, samtidig som du håndterer koding, manglende verdier og parameteroptimalisering på riktig måte.

  1. Krypter målvariabelen ved å bruke LabelEncoder.
  2. Del datasettet i trenings- og testsett med test_size=0.33.
  3. Lag en ColumnTransformer (ct) som kun koder kolonnene 'island' og 'sex' med en passende koder for nominale data (OneHotEncoder) og lar de andre kolonnene være uberørt.
  4. Definer et parametergrid (param_grid) som inkluderer følgende verdier for n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Lag et GridSearchCV-objekt med KNeighborsClassifier som baseestimator og param_grid som parametere.
  6. Bygg en pipeline bestående av:
  • ColumnTransformer (ct);
  • en SimpleImputer (strategi = 'most_frequent');
  • en StandardScaler;
  • og GridSearchCV som siste steg.
  1. Tren pipelinen med treningsdataene (X_train, y_train).
  2. Evaluer modellen på testdataene ved å skrive ut .score(X_test, y_test).
  3. Prediker på testsettet og skriv ut de 5 første dekodede prediksjonene ved å bruke label_enc.inverse_transform().
  4. Til slutt, skriv ut beste estimator funnet av GridSearchCV.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 10
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

close

Awesome!

Completion rate improved to 3.13

bookUtfordring: Sette Alt Sammen

Sveip for å vise menyen

I denne utfordringen skal du anvende hele arbeidsflyten som er gjennomgått i kurset — fra dataprosessering via trening til modelevaluering.

carousel-imgcarousel-imgcarousel-imgcarousel-imgcarousel-img
Oppgave

Swipe to start coding

Du får et datasett med pingviner. Målet ditt er å bygge en maskinlærings-pipeline som klassifiserer pingvinarter ved hjelp av en K-Nearest Neighbors (KNN)-modell, samtidig som du håndterer koding, manglende verdier og parameteroptimalisering på riktig måte.

  1. Krypter målvariabelen ved å bruke LabelEncoder.
  2. Del datasettet i trenings- og testsett med test_size=0.33.
  3. Lag en ColumnTransformer (ct) som kun koder kolonnene 'island' og 'sex' med en passende koder for nominale data (OneHotEncoder) og lar de andre kolonnene være uberørt.
  4. Definer et parametergrid (param_grid) som inkluderer følgende verdier for n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Lag et GridSearchCV-objekt med KNeighborsClassifier som baseestimator og param_grid som parametere.
  6. Bygg en pipeline bestående av:
  • ColumnTransformer (ct);
  • en SimpleImputer (strategi = 'most_frequent');
  • en StandardScaler;
  • og GridSearchCV som siste steg.
  1. Tren pipelinen med treningsdataene (X_train, y_train).
  2. Evaluer modellen på testdataene ved å skrive ut .score(X_test, y_test).
  3. Prediker på testsettet og skriv ut de 5 første dekodede prediksjonene ved å bruke label_enc.inverse_transform().
  4. Til slutt, skriv ut beste estimator funnet av GridSearchCV.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 10
single

single

some-alt