Herausforderung: Erstellung Einer Pipeline
In dieser Aufgabe alle Vorverarbeitungsschritte in einer einzelnen Pipeline unter Verwendung des ursprünglichen penguins.csv-Datensatzes zusammenfassen.
- Entfernen der zwei Zeilen mit unzureichenden Daten.
- Erstellen einer Pipeline, die Kodierung, Imputation und Skalierung umfasst.
Es müssen nur zwei Spalten kodiert werden, 'sex' und 'island'. Da nicht das gesamte X kodiert werden soll, ist die Verwendung eines ColumnTransformer erforderlich. Anschließend wird der SimpleImputer und der StandardScaler auf das gesamte X angewendet.
Hier eine Erinnerung an die Funktionen make_column_transformer() und make_pipeline(), die verwendet werden.
Swipe to start coding
Sie erhalten ein DataFrame namens df, das Pinguindaten enthält.
Ihr Ziel ist es, eine Preprocessing-Pipeline zu erstellen, die fehlende Werte behandelt, kategoriale Spalten kodiert und numerische Merkmale skaliert.
- Importieren Sie die Funktion
make_pipelineaussklearn.pipeline. - Erstellen Sie einen
ColumnTransformernamensct, der einenOneHotEncoderauf die Spalten'sex'und'island'anwendet, während alle anderen Spalten unverändert bleiben (remainder='passthrough'). - Erstellen Sie eine Pipeline, die die folgenden Schritte in der angegebenen Reihenfolge enthält:
- Den von Ihnen definierten
ColumnTransformer(ct); - Einen
SimpleImputermit der Strategie'most_frequent';- Einen
StandardScalerzur Merkmals-Skalierung.
- Einen
- Wenden Sie die Pipeline auf die Merkmalsmatrix
Xan und speichern Sie die transformierten Daten in einer Variablen namensX_transformed.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.13
Herausforderung: Erstellung Einer Pipeline
Swipe um das Menü anzuzeigen
In dieser Aufgabe alle Vorverarbeitungsschritte in einer einzelnen Pipeline unter Verwendung des ursprünglichen penguins.csv-Datensatzes zusammenfassen.
- Entfernen der zwei Zeilen mit unzureichenden Daten.
- Erstellen einer Pipeline, die Kodierung, Imputation und Skalierung umfasst.
Es müssen nur zwei Spalten kodiert werden, 'sex' und 'island'. Da nicht das gesamte X kodiert werden soll, ist die Verwendung eines ColumnTransformer erforderlich. Anschließend wird der SimpleImputer und der StandardScaler auf das gesamte X angewendet.
Hier eine Erinnerung an die Funktionen make_column_transformer() und make_pipeline(), die verwendet werden.
Swipe to start coding
Sie erhalten ein DataFrame namens df, das Pinguindaten enthält.
Ihr Ziel ist es, eine Preprocessing-Pipeline zu erstellen, die fehlende Werte behandelt, kategoriale Spalten kodiert und numerische Merkmale skaliert.
- Importieren Sie die Funktion
make_pipelineaussklearn.pipeline. - Erstellen Sie einen
ColumnTransformernamensct, der einenOneHotEncoderauf die Spalten'sex'und'island'anwendet, während alle anderen Spalten unverändert bleiben (remainder='passthrough'). - Erstellen Sie eine Pipeline, die die folgenden Schritte in der angegebenen Reihenfolge enthält:
- Den von Ihnen definierten
ColumnTransformer(ct); - Einen
SimpleImputermit der Strategie'most_frequent';- Einen
StandardScalerzur Merkmals-Skalierung.
- Einen
- Wenden Sie die Pipeline auf die Merkmalsmatrix
Xan und speichern Sie die transformierten Daten in einer Variablen namensX_transformed.
Lösung
Danke für Ihr Feedback!
single