single
Utfordring: Bruk Oversampling
Sveip for å vise menyen
I denne utfordringen skal du øve på å håndtere skjev klassefordeling i et stort datasett ved å bruke oversampling. Du får en pandas DataFrame som inneholder en målkolonne med ubalanserte klasser. Målet er å lage en ny DataFrame der minoritetsklassen er oversamplet slik at begge klassene har like mange rader. Denne teknikken er nyttig i situasjoner der du vil forhindre at modeller blir skjeve mot majoritetsklassen.
Sveip for å begynne å kode
Gitt en pandas DataFrame med skjev fordeling i målkolonnen, opprett en ny DataFrame der minoritetsklassen er oversamplet slik at hver klasse har like mange rader som majoritetsklassen.
- Identifiser antall forekomster for hver klasse i målkolonnen.
- Bestem klassen med høyest antall forekomster.
- For hver klasse, utfør utvalg med tilbakelegging for å oppnå maksimalt antall forekomster.
- Slå sammen de balanserte delmengdene til en ny DataFrame.
- Returner den balanserte DataFrame-en.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår