Osio 2. Luku 6
single
Haaste: Aineiston Esikäsittely
Pyyhkäise näyttääksesi valikon
Tehtävä
Swipe to start coding
Sinulle on annettu synteettinen aineisto, joka on tallennettu muuttujaan data. Tehtävänäsi on käsitellä puuttuvat arvot ja koodata kategoriset muuttujat asianmukaisesti.
Toimi seuraavasti:
- Korvaa puuttuvat arvot sarakkeessa
'Age'tämän sarakkeen keskiarvolla. Korvaa alkuperäinen sarake tuloksella. - Luo
OneHotEncoder-olio ja tallenna se muuttujaancity_encoder. Määritä parametriksidrop='first'välttääksesi dummy-muuttujaloukun. - Oletuksena tämä enkooderi palauttaa harvan matriisin. Jotta se olisi yhteensopiva Pandasin kanssa myöhemmin, aseta alustuksessa parametri
sparse_output=False(tai vanhemmissa versioissasparse=False), TAI lisää.toarray()kun muunnat dataa. - Koodaa sarakkeen
'City'arvot käyttämälläcity_encoder.fit_transform()ja tallenna tuloksena saatu taulukko muuttujaancity_encoded. - Luo
OrdinalEncoder-olio ja tallenna se muuttujaanincome_encoder. Koska datassa on luonnollinen hierarkia, määritä järjestys eksplisiittisesti käyttämälläcategories-parametria (huomaa, että'Low'<'Middle'<'High'). - Koodaa sarakkeen
'Income'arvot käyttäenincome_encoder-oliota ja korvaa alkuperäinen'Income'-sarake tuloksella.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 2. Luku 6
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme