single
Challenge: Apply Oversampling
Pyyhkäise näyttääksesi valikon
Tässä haasteessa harjoitellaan luokkien epätasapainon käsittelyä suuressa aineistossa käyttämällä ylinäytteistystä. Käytössäsi on pandas DataFrame, joka sisältää kohdesarakkeen epätasapainoisilla luokilla. Tavoitteena on luoda uusi DataFrame, jossa vähemmistön luokkaa ylinäytteistetään niin, että molemmilla luokilla on yhtä monta riviä. Tämä tekniikka on hyödyllinen tilanteissa, joissa halutaan estää mallien vinoutuminen enemmistöluokan suuntaan.
Pyyhkäise aloittaaksesi koodauksen
Kun käytössä on pandas DataFrame, jossa kohdesarakkeessa on luokkien epätasapaino, luo uusi DataFrame, jossa vähemmistön luokkaa yliedustetaan siten, että jokaisessa luokassa on yhtä monta riviä kuin enemmistöluokassa.
- Tunnista kohdesarakkeen luokkien määrät.
- Määritä luokka, jolla on eniten rivejä.
- Ota kustakin luokasta otanta palauttaen rivejä, kunnes saavutetaan suurin määrä.
- Yhdistä tasapainotetut osajoukot uuteen DataFrameen.
- Palauta tasapainotettu DataFrame.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme