Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Challenge: Apply Oversampling | Näytteistämistekniikat Suurille Tietoaineistoille
Suurten datamäärien käsittely Pythonilla
Osio 2. Luku 4
single

single

Challenge: Apply Oversampling

Pyyhkäise näyttääksesi valikon

Tässä haasteessa harjoitellaan luokkien epätasapainon käsittelyä suuressa aineistossa käyttämällä ylinäytteistystä. Käytössäsi on pandas DataFrame, joka sisältää kohdesarakkeen epätasapainoisilla luokilla. Tavoitteena on luoda uusi DataFrame, jossa vähemmistön luokkaa ylinäytteistetään niin, että molemmilla luokilla on yhtä monta riviä. Tämä tekniikka on hyödyllinen tilanteissa, joissa halutaan estää mallien vinoutuminen enemmistöluokan suuntaan.

Tehtävä

Pyyhkäise aloittaaksesi koodauksen

Kun käytössä on pandas DataFrame, jossa kohdesarakkeessa on luokkien epätasapaino, luo uusi DataFrame, jossa vähemmistön luokkaa yliedustetaan siten, että jokaisessa luokassa on yhtä monta riviä kuin enemmistöluokassa.

  • Tunnista kohdesarakkeen luokkien määrät.
  • Määritä luokka, jolla on eniten rivejä.
  • Ota kustakin luokasta otanta palauttaen rivejä, kunnes saavutetaan suurin määrä.
  • Yhdistä tasapainotetut osajoukot uuteen DataFrameen.
  • Palauta tasapainotettu DataFrame.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 4
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

some-alt