Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Aineiston Esikäsittely | Ydinkäsitteet
Klusterianalyysi Pythonilla
Osio 2. Luku 6
single

single

bookHaaste: Aineiston Esikäsittely

Pyyhkäise näyttääksesi valikon

Tehtävä

Swipe to start coding

Sinulle on annettu synteettinen aineisto, joka on tallennettu muuttujaan data. Tehtävänäsi on käsitellä puuttuvat arvot ja koodata kategoriset muuttujat asianmukaisesti.

Toimi seuraavasti:

  • Korvaa puuttuvat arvot sarakkeessa 'Age' tämän sarakkeen keskiarvolla. Korvaa alkuperäinen sarake tuloksella.
  • Luo OneHotEncoder-olio ja tallenna se muuttujaan city_encoder. Määritä parametriksi drop='first' välttääksesi dummy-muuttujaloukun.
  • Oletuksena tämä enkooderi palauttaa harvan matriisin. Jotta se olisi yhteensopiva Pandasin kanssa myöhemmin, aseta alustuksessa parametri sparse_output=False (tai vanhemmissa versioissa sparse=False), TAI lisää .toarray() kun muunnat dataa.
  • Koodaa sarakkeen 'City' arvot käyttämällä city_encoder.fit_transform() ja tallenna tuloksena saatu taulukko muuttujaan city_encoded.
  • Luo OrdinalEncoder-olio ja tallenna se muuttujaan income_encoder. Koska datassa on luonnollinen hierarkia, määritä järjestys eksplisiittisesti käyttämällä categories-parametria (huomaa, että 'Low' < 'Middle' < 'High').
  • Koodaa sarakkeen 'Income' arvot käyttäen income_encoder-oliota ja korvaa alkuperäinen 'Income'-sarake tuloksella.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 6
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

some-alt