Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Kodierung Kategorialer Variablen | Datenvorverarbeitung mit Scikit-Learn
ML-Einführung Mit Scikit-Learn

bookHerausforderung: Kodierung Kategorialer Variablen

Zur Zusammenfassung der vorherigen drei Kapitel zeigt die folgende Tabelle, welchen Encoder Sie verwenden sollten:

In dieser Aufgabe wird der Pinguin-Datensatz (ohne fehlende Werte) bereitgestellt. Alle kategorialen Merkmale, einschließlich des Zielwerts (Spalte 'species'), müssen codiert werden.

Hier eine Erinnerung an die Struktur des Datensatzes:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Beachten Sie, dass 'island' und 'sex' kategoriale Merkmale sind und 'species' ein kategoriales Ziel ist.

Aufgabe

Swipe to start coding

Alle kategorialen Merkmale kodieren. Verwenden Sie One-Hot-Encoding für die Spalten 'island' und 'sex' und wenden Sie einen LabelEncoder (oder einen ähnlichen Target-Encoder) für die Spalte 'species' an. Befolgen Sie diese Schritte, um die Kodierung abzuschließen.

  1. Import von OnehotEncoder und LabelEncoder.
  2. Initialisierung des Feature-Encoder-Objekts.
  3. Kodierung der kategorialen Merkmalsspalten mit dem Objekt feature_enc.
  4. Initialisierung des Target-Encoder-Objekts.
  5. Kodierung des Targets mit dem Objekt label_enc.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 8
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

Awesome!

Completion rate improved to 3.13

bookHerausforderung: Kodierung Kategorialer Variablen

Swipe um das Menü anzuzeigen

Zur Zusammenfassung der vorherigen drei Kapitel zeigt die folgende Tabelle, welchen Encoder Sie verwenden sollten:

In dieser Aufgabe wird der Pinguin-Datensatz (ohne fehlende Werte) bereitgestellt. Alle kategorialen Merkmale, einschließlich des Zielwerts (Spalte 'species'), müssen codiert werden.

Hier eine Erinnerung an die Struktur des Datensatzes:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Beachten Sie, dass 'island' und 'sex' kategoriale Merkmale sind und 'species' ein kategoriales Ziel ist.

Aufgabe

Swipe to start coding

Alle kategorialen Merkmale kodieren. Verwenden Sie One-Hot-Encoding für die Spalten 'island' und 'sex' und wenden Sie einen LabelEncoder (oder einen ähnlichen Target-Encoder) für die Spalte 'species' an. Befolgen Sie diese Schritte, um die Kodierung abzuschließen.

  1. Import von OnehotEncoder und LabelEncoder.
  2. Initialisierung des Feature-Encoder-Objekts.
  3. Kodierung der kategorialen Merkmalsspalten mit dem Objekt feature_enc.
  4. Initialisierung des Target-Encoder-Objekts.
  5. Kodierung des Targets mit dem Objekt label_enc.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

close

Awesome!

Completion rate improved to 3.13
Abschnitt 2. Kapitel 8
single

single

some-alt