Uitdaging: Een Pipeline Maken
In deze uitdaging worden alle preprocessingsstappen gecombineerd in een enkele pipeline met behulp van de originele penguins.csv dataset.
- Verwijder de twee rijen met onvoldoende gegevens.
- Bouw een pipeline die encoderen, imputeren en schalen omvat.
Alleen de kolommen 'sex' en 'island' moeten worden gecodeerd. Omdat niet de gehele X gecodeerd hoeft te worden, is het noodzakelijk om een ColumnTransformer te gebruiken. Vervolgens wordt de SimpleImputer en StandardScaler toegepast op de volledige X.
Hier volgt een herinnering aan de functies make_column_transformer() en make_pipeline() die gebruikt zullen worden.
Swipe to start coding
Je krijgt een DataFrame genaamd df met gegevens over pinguïns.
Het doel is om een preprocessingspipeline te bouwen die ontbrekende waarden verwerkt, categorische kolommen encodeert en numerieke kenmerken schaalt.
- Importeer de functie
make_pipelineuitsklearn.pipeline. - Maak een
ColumnTransformermet de naamctdie eenOneHotEncodertoepast op de kolommen'sex'en'island', terwijl alle andere kolommen ongewijzigd blijven (remainder='passthrough'). - Maak een pipeline die de volgende stappen in volgorde bevat:
- De door jou gedefinieerde
ColumnTransformer(ct); - Een
SimpleImputermet de strategie ingesteld op'most_frequent'; - Een
StandardScalervoor het schalen van kenmerken.
- Pas de pipeline toe op de featurematrix
Xen sla de getransformeerde data op in een variabele genaamdX_transformed.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 3.13
Uitdaging: Een Pipeline Maken
Veeg om het menu te tonen
In deze uitdaging worden alle preprocessingsstappen gecombineerd in een enkele pipeline met behulp van de originele penguins.csv dataset.
- Verwijder de twee rijen met onvoldoende gegevens.
- Bouw een pipeline die encoderen, imputeren en schalen omvat.
Alleen de kolommen 'sex' en 'island' moeten worden gecodeerd. Omdat niet de gehele X gecodeerd hoeft te worden, is het noodzakelijk om een ColumnTransformer te gebruiken. Vervolgens wordt de SimpleImputer en StandardScaler toegepast op de volledige X.
Hier volgt een herinnering aan de functies make_column_transformer() en make_pipeline() die gebruikt zullen worden.
Swipe to start coding
Je krijgt een DataFrame genaamd df met gegevens over pinguïns.
Het doel is om een preprocessingspipeline te bouwen die ontbrekende waarden verwerkt, categorische kolommen encodeert en numerieke kenmerken schaalt.
- Importeer de functie
make_pipelineuitsklearn.pipeline. - Maak een
ColumnTransformermet de naamctdie eenOneHotEncodertoepast op de kolommen'sex'en'island', terwijl alle andere kolommen ongewijzigd blijven (remainder='passthrough'). - Maak een pipeline die de volgende stappen in volgorde bevat:
- De door jou gedefinieerde
ColumnTransformer(ct); - Een
SimpleImputermet de strategie ingesteld op'most_frequent'; - Een
StandardScalervoor het schalen van kenmerken.
- Pas de pipeline toe op de featurematrix
Xen sla de getransformeerde data op in een variabele genaamdX_transformed.
Oplossing
Bedankt voor je feedback!
single