Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Oprettelse af en Pipeline | Pipelines
ML Introduktion med Scikit-learn

bookUdfordring: Oprettelse af en Pipeline

I denne udfordring skal du kombinere alle forbehandlingsskridt i en enkelt pipeline ved hjælp af det oprindelige penguins.csv datasæt.

  1. Fjern de to rækker med utilstrækkelige data.
  2. Opbyg en pipeline, der inkluderer kodning, imputering og skalering.

Du skal kun kode to kolonner, 'sex' og 'island'. Da du ikke ønsker at kode hele X, skal du bruge en ColumnTransformer. Herefter anvendes SimpleImputer og StandardScaler på hele X.

Her er en påmindelse om funktionerne make_column_transformer() og make_pipeline(), som du skal bruge.

Opgave

Swipe to start coding

  1. Importér den korrekte funktion til at oprette en pipeline.
  2. Opret en ColumnTransformer med OneHotEncoder anvendt kun på kolonnerne 'sex' og 'island'.
  3. Sørg for, at alle andre kolonner forbliver uændrede.
  4. Opret en pipeline, der indeholder den netop oprettede ct, en SimpleImputer, der udfylder manglende værdier med den mest hyppige værdi, samt en StandardScaler som sidste trin.
  5. Transformér X ved hjælp af den oprettede pipe.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 4
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you show me how to build the pipeline step by step?

What should I use for encoding the 'sex' and 'island' columns?

How do I remove the two rows with insufficient data?

close

Awesome!

Completion rate improved to 3.13

bookUdfordring: Oprettelse af en Pipeline

Stryg for at vise menuen

I denne udfordring skal du kombinere alle forbehandlingsskridt i en enkelt pipeline ved hjælp af det oprindelige penguins.csv datasæt.

  1. Fjern de to rækker med utilstrækkelige data.
  2. Opbyg en pipeline, der inkluderer kodning, imputering og skalering.

Du skal kun kode to kolonner, 'sex' og 'island'. Da du ikke ønsker at kode hele X, skal du bruge en ColumnTransformer. Herefter anvendes SimpleImputer og StandardScaler på hele X.

Her er en påmindelse om funktionerne make_column_transformer() og make_pipeline(), som du skal bruge.

Opgave

Swipe to start coding

  1. Importér den korrekte funktion til at oprette en pipeline.
  2. Opret en ColumnTransformer med OneHotEncoder anvendt kun på kolonnerne 'sex' og 'island'.
  3. Sørg for, at alle andre kolonner forbliver uændrede.
  4. Opret en pipeline, der indeholder den netop oprettede ct, en SimpleImputer, der udfylder manglende værdier med den mest hyppige værdi, samt en StandardScaler som sidste trin.
  5. Transformér X ved hjælp af den oprettede pipe.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

close

Awesome!

Completion rate improved to 3.13
Sektion 3. Kapitel 4
single

single

some-alt