single
Utmaning: Tillämpa översampling
Svep för att visa menyn
I denna utmaning får du öva på att hantera obalans mellan klasser i en stor datamängd genom att använda översampling. Du får en pandas DataFrame som innehåller en målkolumn med obalanserade klasser. Målet är att skapa en ny DataFrame där minoritetsklassen översamplas så att båda klasserna har lika många rader. Denna teknik är användbar i situationer där du vill förhindra att modeller blir partiska mot majoritetsklassen.
Svep för att börja koda
Givet en pandas DataFrame med obalans mellan klasserna i målkolumnen, skapa en ny DataFrame där minoritetsklassen översamplas så att varje klass har lika många rader som majoritetsklassen.
- Identifiera antalet förekomster för varje klass i målkolumnen.
- Bestäm vilken klass som har flest förekomster.
- För varje klass, sampelera med återläggning tills det maximala antalet uppnås.
- Slå ihop de balanserade delmängderna till en ny DataFrame.
- Returnera den balanserade DataFrame.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal