Udfordring: Oprettelse af en Pipeline
I denne udfordring skal du kombinere alle forbehandlingsskridt i en enkelt pipeline ved hjælp af det oprindelige penguins.csv
datasæt.
- Fjern de to rækker med utilstrækkelige data.
- Opbyg en pipeline, der inkluderer kodning, imputering og skalering.
Du skal kun kode to kolonner, 'sex'
og 'island'
. Da du ikke ønsker at kode hele X
, skal du bruge en ColumnTransformer
. Herefter anvendes SimpleImputer
og StandardScaler
på hele X
.
Her er en påmindelse om funktionerne make_column_transformer()
og make_pipeline()
, som du skal bruge.
Swipe to start coding
- Importér den korrekte funktion til at oprette en pipeline.
- Opret en
ColumnTransformer
medOneHotEncoder
anvendt kun på kolonnerne'sex'
og'island'
. - Sørg for, at alle andre kolonner forbliver uændrede.
- Opret en pipeline, der indeholder den netop oprettede
ct
, enSimpleImputer
, der udfylder manglende værdier med den mest hyppige værdi, samt enStandardScaler
som sidste trin. - Transformér
X
ved hjælp af den oprettedepipe
.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Can you show me how to build the pipeline step by step?
What should I use for encoding the 'sex' and 'island' columns?
How do I remove the two rows with insufficient data?
Awesome!
Completion rate improved to 3.13
Udfordring: Oprettelse af en Pipeline
Stryg for at vise menuen
I denne udfordring skal du kombinere alle forbehandlingsskridt i en enkelt pipeline ved hjælp af det oprindelige penguins.csv
datasæt.
- Fjern de to rækker med utilstrækkelige data.
- Opbyg en pipeline, der inkluderer kodning, imputering og skalering.
Du skal kun kode to kolonner, 'sex'
og 'island'
. Da du ikke ønsker at kode hele X
, skal du bruge en ColumnTransformer
. Herefter anvendes SimpleImputer
og StandardScaler
på hele X
.
Her er en påmindelse om funktionerne make_column_transformer()
og make_pipeline()
, som du skal bruge.
Swipe to start coding
- Importér den korrekte funktion til at oprette en pipeline.
- Opret en
ColumnTransformer
medOneHotEncoder
anvendt kun på kolonnerne'sex'
og'island'
. - Sørg for, at alle andre kolonner forbliver uændrede.
- Opret en pipeline, der indeholder den netop oprettede
ct
, enSimpleImputer
, der udfylder manglende værdier med den mest hyppige værdi, samt enStandardScaler
som sidste trin. - Transformér
X
ved hjælp af den oprettedepipe
.
Løsning
Tak for dine kommentarer!
Awesome!
Completion rate improved to 3.13single