Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Utmaning: Tillämpa översampling | Samplingtekniker för Stora Data
Hantering av Stora Datamängder med Python
Avsnitt 2. Kapitel 4
single

single

Utmaning: Tillämpa översampling

Svep för att visa menyn

I denna utmaning får du öva på att hantera obalans mellan klasser i en stor datamängd genom att använda översampling. Du får en pandas DataFrame som innehåller en målkolumn med obalanserade klasser. Målet är att skapa en ny DataFrame där minoritetsklassen översamplas så att båda klasserna har lika många rader. Denna teknik är användbar i situationer där du vill förhindra att modeller blir partiska mot majoritetsklassen.

Uppgift

Svep för att börja koda

Givet en pandas DataFrame med obalans mellan klasserna i målkolumnen, skapa en ny DataFrame där minoritetsklassen översamplas så att varje klass har lika många rader som majoritetsklassen.

  • Identifiera antalet förekomster för varje klass i målkolumnen.
  • Bestäm vilken klass som har flest förekomster.
  • För varje klass, sampelera med återläggning tills det maximala antalet uppnås.
  • Slå ihop de balanserade delmängderna till en ny DataFrame.
  • Returnera den balanserade DataFrame.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 4
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

some-alt