Udfordring: Oprettelse af en Pipeline
I denne udfordring skal alle forbehandlingsskridt kombineres i en enkelt pipeline ved brug af det originale penguins.csv
datasæt.
- Fjern de to rækker med utilstrækkelige data.
- Opbyg en pipeline, der inkluderer kodning, imputering og skalering.
Det er kun nødvendigt at kode to kolonner, 'sex'
og 'island'
. Da du ikke ønsker at kode hele X
, skal du anvende en ColumnTransformer
. Herefter skal SimpleImputer
og StandardScaler
anvendes på hele X
.
Her er en påmindelse om funktionerne make_column_transformer()
og make_pipeline()
, som du skal bruge.
Swipe to start coding
- Importér den korrekte funktion til at oprette en pipeline.
- Opret en
ColumnTransformer
medOneHotEncoder
anvendt kun på kolonnerne'sex'
og'island'
. - Sørg for, at alle andre kolonner forbliver uændrede.
- Opret en pipeline, der indeholder den netop oprettede
ct
, enSimpleImputer
, der udfylder manglende værdier med den mest hyppige værdi, samt enStandardScaler
som sidste trin. - Transformér
X
ved hjælp af den oprettedepipe
.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Can you show me how to build the pipeline step by step?
What should I use for encoding the 'sex' and 'island' columns?
How do I remove the two rows with insufficient data?
Awesome!
Completion rate improved to 3.13
Udfordring: Oprettelse af en Pipeline
Stryg for at vise menuen
I denne udfordring skal alle forbehandlingsskridt kombineres i en enkelt pipeline ved brug af det originale penguins.csv
datasæt.
- Fjern de to rækker med utilstrækkelige data.
- Opbyg en pipeline, der inkluderer kodning, imputering og skalering.
Det er kun nødvendigt at kode to kolonner, 'sex'
og 'island'
. Da du ikke ønsker at kode hele X
, skal du anvende en ColumnTransformer
. Herefter skal SimpleImputer
og StandardScaler
anvendes på hele X
.
Her er en påmindelse om funktionerne make_column_transformer()
og make_pipeline()
, som du skal bruge.
Swipe to start coding
- Importér den korrekte funktion til at oprette en pipeline.
- Opret en
ColumnTransformer
medOneHotEncoder
anvendt kun på kolonnerne'sex'
og'island'
. - Sørg for, at alle andre kolonner forbliver uændrede.
- Opret en pipeline, der indeholder den netop oprettede
ct
, enSimpleImputer
, der udfylder manglende værdier med den mest hyppige værdi, samt enStandardScaler
som sidste trin. - Transformér
X
ved hjælp af den oprettedepipe
.
Løsning
Tak for dine kommentarer!
single