Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Kodierung Kategorialer Variablen | Datenvorverarbeitung mit Scikit-Learn
Practice
Projects
Quizzes & Challenges
Quizzes
Challenges
/
Einführung in das Maschinelle Lernen mit Python

bookHerausforderung: Kodierung Kategorialer Variablen

Zur Zusammenfassung der vorherigen drei Kapitel finden Sie hier eine Tabelle, die zeigt, welchen Encoder Sie verwenden sollten:

In dieser Aufgabe arbeiten Sie mit dem Penguins-Datensatz (keine fehlenden Werte). Alle kategorialen Merkmale — einschließlich des Zielwerts 'species' — müssen für den Einsatz im maschinellen Lernen codiert werden.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Beachte, dass 'island' und 'sex' kategoriale Merkmale sind und 'species' ein kategoriales Ziel ist.

Aufgabe

Swipe to start coding

Sie erhalten ein DataFrame namens df. Kodieren Sie alle kategorialen Spalten:

  1. Importieren Sie OneHotEncoder und LabelEncoder aus sklearn.preprocessing.
  2. Teilen Sie die Daten in X (Merkmale) und y (Zielvariable) auf.
  3. Erstellen Sie einen OneHotEncoder und wenden Sie ihn auf die Spalten 'island' und 'sex' in X an.
  4. Ersetzen Sie diese Originalspalten durch ihre kodierten Versionen.
  5. Verwenden Sie LabelEncoder für die Spalte 'species', um y zu kodieren.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 8
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

bookHerausforderung: Kodierung Kategorialer Variablen

Swipe um das Menü anzuzeigen

Zur Zusammenfassung der vorherigen drei Kapitel finden Sie hier eine Tabelle, die zeigt, welchen Encoder Sie verwenden sollten:

In dieser Aufgabe arbeiten Sie mit dem Penguins-Datensatz (keine fehlenden Werte). Alle kategorialen Merkmale — einschließlich des Zielwerts 'species' — müssen für den Einsatz im maschinellen Lernen codiert werden.

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Beachte, dass 'island' und 'sex' kategoriale Merkmale sind und 'species' ein kategoriales Ziel ist.

Aufgabe

Swipe to start coding

Sie erhalten ein DataFrame namens df. Kodieren Sie alle kategorialen Spalten:

  1. Importieren Sie OneHotEncoder und LabelEncoder aus sklearn.preprocessing.
  2. Teilen Sie die Daten in X (Merkmale) und y (Zielvariable) auf.
  3. Erstellen Sie einen OneHotEncoder und wenden Sie ihn auf die Spalten 'island' und 'sex' in X an.
  4. Ersetzen Sie diese Originalspalten durch ihre kodierten Versionen.
  5. Verwenden Sie LabelEncoder für die Spalte 'species', um y zu kodieren.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 8
single

single

some-alt