Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Vorverarbeitung des Datensatzes | Kernkonzepte
Clusteranalyse Mit Python
Abschnitt 2. Kapitel 6
single

single

bookHerausforderung: Vorverarbeitung des Datensatzes

Swipe um das Menü anzuzeigen

Aufgabe

Swipe to start coding

Sie erhalten einen synthetischen Datensatz, der in der Variablen data gespeichert ist. Ihre Aufgabe besteht darin, fehlende Werte zu behandeln und kategoriale Merkmale korrekt zu kodieren.

Gehen Sie wie folgt vor:

  • Ersetzen Sie fehlende Werte in der Spalte 'Age' durch den Mittelwert dieser Spalte. Überschreiben Sie die Originalspalte mit dem Ergebnis.
  • Erstellen Sie eine Instanz von OneHotEncoder und speichern Sie sie in der Variablen city_encoder. Geben Sie dabei drop='first' an, um die Dummy-Variable-Falle zu vermeiden.
    • Standardmäßig gibt dieser Encoder eine Sparse-Matrix zurück. Um später die Kompatibilität mit Pandas zu gewährleisten, setzen Sie beim Initialisieren den Parameter sparse_output=False (oder sparse=False für ältere Versionen), ODER fügen Sie beim Transformieren .toarray() hinzu.
  • Kodieren Sie die Werte in der Spalte 'City' mit city_encoder.fit_transform() und speichern Sie das resultierende Array in der Variablen city_encoded.
  • Erstellen Sie eine Instanz von OrdinalEncoder und speichern Sie sie in der Variablen income_encoder. Da die Daten eine natürliche Hierarchie aufweisen, definieren Sie die Reihenfolge explizit mit dem Parameter categories (beachten Sie: 'Low' < 'Middle' < 'High').
  • Kodieren Sie die Werte in der Spalte 'Income' mit income_encoder und überschreiben Sie die Originalspalte 'Income' mit dem Ergebnis.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 6
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

some-alt