Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Erstellung Einer Pipeline | Pipelines
ML-Einführung Mit Scikit-Learn

bookHerausforderung: Erstellung Einer Pipeline

In dieser Aufgabe alle Vorverarbeitungsschritte in einer einzelnen Pipeline unter Verwendung des ursprünglichen penguins.csv-Datensatzes zusammenfassen.

  1. Entfernen der zwei Zeilen mit unzureichenden Daten.
  2. Erstellen einer Pipeline, die Kodierung, Imputation und Skalierung umfasst.

Es müssen nur zwei Spalten kodiert werden, 'sex' und 'island'. Da nicht das gesamte X kodiert werden soll, ist die Verwendung eines ColumnTransformer erforderlich. Anschließend wird der SimpleImputer und der StandardScaler auf das gesamte X angewendet.

Hier eine Erinnerung an die Funktionen make_column_transformer() und make_pipeline(), die verwendet werden.

Aufgabe

Swipe to start coding

Sie erhalten ein DataFrame namens df, das Pinguindaten enthält. Ihr Ziel ist es, eine Preprocessing-Pipeline zu erstellen, die fehlende Werte behandelt, kategoriale Spalten kodiert und numerische Merkmale skaliert.

  1. Importieren Sie die Funktion make_pipeline aus sklearn.pipeline.
  2. Erstellen Sie einen ColumnTransformer namens ct, der einen OneHotEncoder auf die Spalten 'sex' und 'island' anwendet, während alle anderen Spalten unverändert bleiben (remainder='passthrough').
  3. Erstellen Sie eine Pipeline, die die folgenden Schritte in der angegebenen Reihenfolge enthält:
  • Den von Ihnen definierten ColumnTransformer (ct);
  • Einen SimpleImputer mit der Strategie 'most_frequent';
    • Einen StandardScaler zur Merkmals-Skalierung.
  1. Wenden Sie die Pipeline auf die Merkmalsmatrix X an und speichern Sie die transformierten Daten in einer Variablen namens X_transformed.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 4
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

Awesome!

Completion rate improved to 3.13

bookHerausforderung: Erstellung Einer Pipeline

Swipe um das Menü anzuzeigen

In dieser Aufgabe alle Vorverarbeitungsschritte in einer einzelnen Pipeline unter Verwendung des ursprünglichen penguins.csv-Datensatzes zusammenfassen.

  1. Entfernen der zwei Zeilen mit unzureichenden Daten.
  2. Erstellen einer Pipeline, die Kodierung, Imputation und Skalierung umfasst.

Es müssen nur zwei Spalten kodiert werden, 'sex' und 'island'. Da nicht das gesamte X kodiert werden soll, ist die Verwendung eines ColumnTransformer erforderlich. Anschließend wird der SimpleImputer und der StandardScaler auf das gesamte X angewendet.

Hier eine Erinnerung an die Funktionen make_column_transformer() und make_pipeline(), die verwendet werden.

Aufgabe

Swipe to start coding

Sie erhalten ein DataFrame namens df, das Pinguindaten enthält. Ihr Ziel ist es, eine Preprocessing-Pipeline zu erstellen, die fehlende Werte behandelt, kategoriale Spalten kodiert und numerische Merkmale skaliert.

  1. Importieren Sie die Funktion make_pipeline aus sklearn.pipeline.
  2. Erstellen Sie einen ColumnTransformer namens ct, der einen OneHotEncoder auf die Spalten 'sex' und 'island' anwendet, während alle anderen Spalten unverändert bleiben (remainder='passthrough').
  3. Erstellen Sie eine Pipeline, die die folgenden Schritte in der angegebenen Reihenfolge enthält:
  • Den von Ihnen definierten ColumnTransformer (ct);
  • Einen SimpleImputer mit der Strategie 'most_frequent';
    • Einen StandardScaler zur Merkmals-Skalierung.
  1. Wenden Sie die Pipeline auf die Merkmalsmatrix X an und speichern Sie die transformierten Daten in einer Variablen namens X_transformed.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 3. Kapitel 4
single

single

some-alt