Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Uitdaging: Een Pipeline Maken | Pipelines
ML-Introductie Met Scikit-Learn

bookUitdaging: Een Pipeline Maken

In deze uitdaging worden alle preprocessingsstappen gecombineerd in een enkele pipeline met behulp van de originele penguins.csv dataset.

  1. Verwijder de twee rijen met onvoldoende gegevens.
  2. Bouw een pipeline die encoderen, imputeren en schalen omvat.

Alleen de kolommen 'sex' en 'island' moeten worden gecodeerd. Omdat niet de gehele X gecodeerd hoeft te worden, is het noodzakelijk om een ColumnTransformer te gebruiken. Vervolgens wordt de SimpleImputer en StandardScaler toegepast op de volledige X.

Hier volgt een herinnering aan de functies make_column_transformer() en make_pipeline() die gebruikt zullen worden.

Taak

Swipe to start coding

Je krijgt een DataFrame genaamd df met gegevens over pinguïns. Het doel is om een preprocessingspipeline te bouwen die ontbrekende waarden verwerkt, categorische kolommen encodeert en numerieke kenmerken schaalt.

  1. Importeer de functie make_pipeline uit sklearn.pipeline.
  2. Maak een ColumnTransformer met de naam ct die een OneHotEncoder toepast op de kolommen 'sex' en 'island', terwijl alle andere kolommen ongewijzigd blijven (remainder='passthrough').
  3. Maak een pipeline die de volgende stappen in volgorde bevat:
  • De door jou gedefinieerde ColumnTransformer (ct);
  • Een SimpleImputer met de strategie ingesteld op 'most_frequent';
  • Een StandardScaler voor het schalen van kenmerken.
  1. Pas de pipeline toe op de featurematrix X en sla de getransformeerde data op in een variabele genaamd X_transformed.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 4
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

Awesome!

Completion rate improved to 3.13

bookUitdaging: Een Pipeline Maken

Veeg om het menu te tonen

In deze uitdaging worden alle preprocessingsstappen gecombineerd in een enkele pipeline met behulp van de originele penguins.csv dataset.

  1. Verwijder de twee rijen met onvoldoende gegevens.
  2. Bouw een pipeline die encoderen, imputeren en schalen omvat.

Alleen de kolommen 'sex' en 'island' moeten worden gecodeerd. Omdat niet de gehele X gecodeerd hoeft te worden, is het noodzakelijk om een ColumnTransformer te gebruiken. Vervolgens wordt de SimpleImputer en StandardScaler toegepast op de volledige X.

Hier volgt een herinnering aan de functies make_column_transformer() en make_pipeline() die gebruikt zullen worden.

Taak

Swipe to start coding

Je krijgt een DataFrame genaamd df met gegevens over pinguïns. Het doel is om een preprocessingspipeline te bouwen die ontbrekende waarden verwerkt, categorische kolommen encodeert en numerieke kenmerken schaalt.

  1. Importeer de functie make_pipeline uit sklearn.pipeline.
  2. Maak een ColumnTransformer met de naam ct die een OneHotEncoder toepast op de kolommen 'sex' en 'island', terwijl alle andere kolommen ongewijzigd blijven (remainder='passthrough').
  3. Maak een pipeline die de volgende stappen in volgorde bevat:
  • De door jou gedefinieerde ColumnTransformer (ct);
  • Een SimpleImputer met de strategie ingesteld op 'most_frequent';
  • Een StandardScaler voor het schalen van kenmerken.
  1. Pas de pipeline toe op de featurematrix X en sla de getransformeerde data op in een variabele genaamd X_transformed.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 4
single

single

some-alt