Abschnitt 3. Kapitel 4
single
Herausforderung: Preprocessing-Pipeline
Swipe um das Menü anzuzeigen
Aufgabe
Swipe to start coding
Sie erhalten den Titanic-Datensatz aus der seaborn-Bibliothek.
Ihre Aufgabe ist es, eine vollständige Preprocessing-Pipeline zu erstellen, die alle wesentlichen Datenumwandlungen vor dem maschinellen Lernen durchführt.
Folgen Sie diesen Schritten:
- Laden Sie den Datensatz mit
sns.load_dataset("titanic"). - Behandeln Sie fehlende Werte:
- Numerische Spalten → mit dem Mittelwert auffüllen.
- Kategorische Spalten → mit dem Modus auffüllen.
- Kodieren Sie die kategorialen Merkmale
sexundembarkedmitpd.get_dummies(). - Skalieren Sie die numerischen Spalten
ageundfaremitStandardScaler. - Erstellen Sie ein neues Merkmal
family_size = sibsp + parch + 1. - Fassen Sie alle Transformationen in einer Funktion namens
preprocess_titanic(data)zusammen, die das final verarbeitete DataFrame zurückgibt. - Weisen Sie den verarbeiteten Datensatz einer Variablen namens
processed_datazu.
Geben Sie die ersten 5 Zeilen des finalen DataFrames aus.
Lösung
War alles klar?
Danke für Ihr Feedback!
Abschnitt 3. Kapitel 4
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen