single
Challenge: Anwendung von Oversampling
Swipe um das Menü anzuzeigen
In dieser Aufgabe üben Sie den Umgang mit einem unausgeglichenen Klassenverhältnis in einem großen Datensatz durch Anwendung von Oversampling. Sie erhalten ein pandas DataFrame, das eine Zielspalte mit unausgeglichenen Klassen enthält. Ihr Ziel ist es, ein neues DataFrame zu erstellen, in dem die Minderheitsklasse so oft dupliziert wird, dass beide Klassen die gleiche Anzahl an Zeilen aufweisen. Diese Technik ist nützlich, um zu verhindern, dass Modelle eine Verzerrung zugunsten der Mehrheitsklasse entwickeln.
Wischen, um mit dem Codieren zu beginnen
Gegeben ist ein pandas DataFrame mit einem Klassenungleichgewicht in der Zielspalte. Erstellen Sie ein neues DataFrame, in dem die Minderheitsklasse so oft überschrieben wird, dass jede Klasse die gleiche Anzahl an Zeilen wie die Mehrheitsklasse aufweist.
- Ermittlung der Klassenanzahl in der Zielspalte.
- Bestimmung der Klasse mit der höchsten Anzahl.
- Für jede Klasse Stichproben mit Zurücklegen ziehen, um die maximale Anzahl zu erreichen.
- Zusammenfügen der ausgeglichenen Teilmengen zu einem neuen DataFrame.
- Rückgabe des ausgeglichenen DataFrames.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen