Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Challenge: Anvend Oversampling | Udtagningsmetoder til Store Data
Håndtering af Store Datamængder med Python
Sektion 2. Kapitel 4
single

single

Challenge: Anvend Oversampling

Stryg for at vise menuen

I denne udfordring skal du øve dig i at håndtere klasse-ubalance i et stort datasæt ved at anvende oversampling. Du får stillet en pandas DataFrame til rådighed, som indeholder en målkolonne med ubalancerede klasser. Dit mål er at oprette en ny DataFrame, hvor minoritetsklassen er oversamplet, så begge klasser har samme antal rækker. Denne teknik er nyttig i situationer, hvor du vil undgå, at modeller bliver forudindtaget over for majoritetsklassen.

Opgave

Swipe to start coding

Givet en pandas DataFrame med en skæv fordeling i målkolonnen, opret en ny DataFrame, hvor minoritetsklassen er oversamplet, så hver klasse har samme antal rækker som majoritetsklassen.

  • Identificering af klassefordelingen i målkolonnen.
  • Bestemmelse af klassen med det maksimale antal forekomster.
  • For hver klasse, udtagning med tilbageføring for at opnå det maksimale antal forekomster.
  • Sammenkædning af de balancerede delmængder til en ny DataFrame.
  • Returnering af den balancerede DataFrame.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 4
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

some-alt