Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Challenge: Anwendung von Oversampling | Sampling-Techniken Für Große Daten
Umgang Mit Großen Datenmengen Mit Python
Abschnitt 2. Kapitel 4
single

single

Challenge: Anwendung von Oversampling

Swipe um das Menü anzuzeigen

In dieser Aufgabe üben Sie den Umgang mit einem unausgeglichenen Klassenverhältnis in einem großen Datensatz durch Anwendung von Oversampling. Sie erhalten ein pandas DataFrame, das eine Zielspalte mit unausgeglichenen Klassen enthält. Ihr Ziel ist es, ein neues DataFrame zu erstellen, in dem die Minderheitsklasse so oft dupliziert wird, dass beide Klassen die gleiche Anzahl an Zeilen aufweisen. Diese Technik ist nützlich, um zu verhindern, dass Modelle eine Verzerrung zugunsten der Mehrheitsklasse entwickeln.

Aufgabe

Wischen, um mit dem Codieren zu beginnen

Gegeben ist ein pandas DataFrame mit einem Klassenungleichgewicht in der Zielspalte. Erstellen Sie ein neues DataFrame, in dem die Minderheitsklasse so oft überschrieben wird, dass jede Klasse die gleiche Anzahl an Zeilen wie die Mehrheitsklasse aufweist.

  • Ermittlung der Klassenanzahl in der Zielspalte.
  • Bestimmung der Klasse mit der höchsten Anzahl.
  • Für jede Klasse Stichproben mit Zurücklegen ziehen, um die maximale Anzahl zu erreichen.
  • Zusammenfügen der ausgeglichenen Teilmengen zu einem neuen DataFrame.
  • Rückgabe des ausgeglichenen DataFrames.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 4
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

some-alt