Herausforderung: Erstellung Einer Pipeline
In dieser Aufgabe sollen alle von uns durchgeführten Vorverarbeitungsschritte in einer Pipeline zusammengeführt werden. Der Datensatz ist die ursprüngliche Datei penguins.csv
, mit der wir begonnen haben.
Der erste Schritt besteht darin, zwei unnötige Zeilen zu entfernen. Anschließend soll eine Pipeline erstellt werden, die Kodierung, Imputation und Skalierung umfasst.
Es müssen nur zwei Spalten kodiert werden, 'sex'
und 'island'
. Da nicht das gesamte X
kodiert werden soll, muss ein ColumnTransformer
verwendet werden. Danach wird auf das gesamte SimpleImputer
der StandardScaler
und der X
angewendet.
Hier eine Erinnerung an die Funktionen make_column_transformer()
und make_pipeline()
, die verwendet werden.
Swipe to start coding
- Importieren der korrekten Funktion zur Erstellung einer Pipeline.
- Erstellen eines
ColumnTransformer
mit demOneHotEncoder
, der nur auf die Spalten'sex'
und'island'
angewendet wird. - Sicherstellen, dass alle anderen Spalten unverändert bleiben.
- Erstellen einer Pipeline, die den soeben erstellten
ct
, einenSimpleImputer
, der fehlende Werte mit dem häufigsten Wert auffüllt, sowie einenStandardScaler
als letzten Schritt enthält. - Transformation von
X
mit dem erstelltenpipe
.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Awesome!
Completion rate improved to 3.13
Herausforderung: Erstellung Einer Pipeline
Swipe um das Menü anzuzeigen
In dieser Aufgabe sollen alle von uns durchgeführten Vorverarbeitungsschritte in einer Pipeline zusammengeführt werden. Der Datensatz ist die ursprüngliche Datei penguins.csv
, mit der wir begonnen haben.
Der erste Schritt besteht darin, zwei unnötige Zeilen zu entfernen. Anschließend soll eine Pipeline erstellt werden, die Kodierung, Imputation und Skalierung umfasst.
Es müssen nur zwei Spalten kodiert werden, 'sex'
und 'island'
. Da nicht das gesamte X
kodiert werden soll, muss ein ColumnTransformer
verwendet werden. Danach wird auf das gesamte SimpleImputer
der StandardScaler
und der X
angewendet.
Hier eine Erinnerung an die Funktionen make_column_transformer()
und make_pipeline()
, die verwendet werden.
Swipe to start coding
- Importieren der korrekten Funktion zur Erstellung einer Pipeline.
- Erstellen eines
ColumnTransformer
mit demOneHotEncoder
, der nur auf die Spalten'sex'
und'island'
angewendet wird. - Sicherstellen, dass alle anderen Spalten unverändert bleiben.
- Erstellen einer Pipeline, die den soeben erstellten
ct
, einenSimpleImputer
, der fehlende Werte mit dem häufigsten Wert auffüllt, sowie einenStandardScaler
als letzten Schritt enthält. - Transformation von
X
mit dem erstelltenpipe
.
Lösung
Danke für Ihr Feedback!
Awesome!
Completion rate improved to 3.13single