single
Challenge: Anvend Oversampling
Stryg for at vise menuen
I denne udfordring skal du øve dig i at håndtere klasse-ubalance i et stort datasæt ved at anvende oversampling. Du får stillet en pandas DataFrame til rådighed, som indeholder en målkolonne med ubalancerede klasser. Dit mål er at oprette en ny DataFrame, hvor minoritetsklassen er oversamplet, så begge klasser har samme antal rækker. Denne teknik er nyttig i situationer, hvor du vil undgå, at modeller bliver forudindtaget over for majoritetsklassen.
Swipe to start coding
Givet en pandas DataFrame med en skæv fordeling i målkolonnen, opret en ny DataFrame, hvor minoritetsklassen er oversamplet, så hver klasse har samme antal rækker som majoritetsklassen.
- Identificering af klassefordelingen i målkolonnen.
- Bestemmelse af klassen med det maksimale antal forekomster.
- For hver klasse, udtagning med tilbageføring for at opnå det maksimale antal forekomster.
- Sammenkædning af de balancerede delmængder til en ny DataFrame.
- Returnering af den balancerede DataFrame.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat