Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: Lage en Pipeline | Pipeliner
Introduksjon til ML med Scikit-learn

bookUtfordring: Lage en Pipeline

I denne utfordringen skal du kombinere alle forhåndsbehandlingsstegene i en enkel pipeline ved å bruke det originale penguins.csv-datasettet.

  1. Fjern de to radene med utilstrekkelige data.
  2. Bygg en pipeline som inkluderer koding, imputering og skalering.

Du trenger kun å kode to kolonner, 'sex' og 'island'. Siden du ikke ønsker å kode hele X, må du bruke en ColumnTransformer. Deretter skal du bruke SimpleImputer og StandardScaler på hele X.

Her er en påminnelse om funksjonene make_column_transformer() og make_pipeline() som du skal bruke.

Oppgave

Swipe to start coding

Du har fått en DataFrame kalt df som inneholder pingvindata. Målet ditt er å bygge en forhåndsprosesseringspipeline som håndterer manglende verdier, koder kategoriske kolonner og skalerer numeriske funksjoner.

  1. Importer funksjonen make_pipeline fra sklearn.pipeline.
  2. Opprett en ColumnTransformer kalt ct som bruker en OneHotEncoder på kolonnene 'sex' og 'island', mens alle andre kolonner beholdes uendret (remainder='passthrough').
  3. Lag en pipeline som inkluderer følgende steg i rekkefølge:
    • ColumnTransformer-en du definerte (ct);
  • En SimpleImputer med strategi satt til 'most_frequent';
  • En StandardScaler for skalering av funksjoner.
  1. Bruk pipelinen på funksjonsmatrisen X og lagre de transformerede dataene i en variabel kalt X_transformed.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 4
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

close

Awesome!

Completion rate improved to 3.13

bookUtfordring: Lage en Pipeline

Sveip for å vise menyen

I denne utfordringen skal du kombinere alle forhåndsbehandlingsstegene i en enkel pipeline ved å bruke det originale penguins.csv-datasettet.

  1. Fjern de to radene med utilstrekkelige data.
  2. Bygg en pipeline som inkluderer koding, imputering og skalering.

Du trenger kun å kode to kolonner, 'sex' og 'island'. Siden du ikke ønsker å kode hele X, må du bruke en ColumnTransformer. Deretter skal du bruke SimpleImputer og StandardScaler på hele X.

Her er en påminnelse om funksjonene make_column_transformer() og make_pipeline() som du skal bruke.

Oppgave

Swipe to start coding

Du har fått en DataFrame kalt df som inneholder pingvindata. Målet ditt er å bygge en forhåndsprosesseringspipeline som håndterer manglende verdier, koder kategoriske kolonner og skalerer numeriske funksjoner.

  1. Importer funksjonen make_pipeline fra sklearn.pipeline.
  2. Opprett en ColumnTransformer kalt ct som bruker en OneHotEncoder på kolonnene 'sex' og 'island', mens alle andre kolonner beholdes uendret (remainder='passthrough').
  3. Lag en pipeline som inkluderer følgende steg i rekkefølge:
    • ColumnTransformer-en du definerte (ct);
  • En SimpleImputer med strategi satt til 'most_frequent';
  • En StandardScaler for skalering av funksjoner.
  1. Bruk pipelinen på funksjonsmatrisen X og lagre de transformerede dataene i en variabel kalt X_transformed.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 4
single

single

some-alt