Haaste: Putkiston Luominen
Tässä haasteessa yhdistä kaikki esikäsittelyvaiheet yhdeksi putkeksi käyttäen alkuperäistä penguins.csv-aineistoa.
- Poista kaksi riviä, joissa on puutteelliset tiedot.
- Rakenna putki, joka sisältää koodauksen, imputoinnin ja skaalaamisen.
Sinun tarvitsee koodata vain kaksi saraketta, 'sex' ja 'island'. Koska et halua koodata koko X:ää, sinun täytyy käyttää ColumnTransformer-luokkaa. Tämän jälkeen käytä SimpleImputer- ja StandardScaler-luokkia koko X:ään.
Tässä muistutuksena make_column_transformer()- ja make_pipeline()-funktiot, joita tulet käyttämään.
Swipe to start coding
Sinulle annetaan DataFrame nimeltä df, joka sisältää pingviinien tietoja.
Tavoitteena on rakentaa esikäsittelyputki, joka käsittelee puuttuvat arvot, koodaa kategoriset sarakkeet ja skaalaa numeeriset ominaisuudet.
- Tuo
make_pipeline-funktio kirjastostasklearn.pipeline. - Luo
ColumnTransformernimeltäct, joka käyttääOneHotEncoder-kooderia sarakkeisiin'sex'ja'island'säilyttäen muut sarakkeet muuttumattomina (remainder='passthrough'). - Luo putki, joka sisältää seuraavat vaiheet järjestyksessä:
- Määrittelemäsi
ColumnTransformer(ct); SimpleImputer, jonka strategiana on'most_frequent';StandardScalerominaisuuksien skaalausta varten.
- Käytä putkea piirre-matriisiin
Xja tallenna muunnetut tiedot muuttujaanX_transformed.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 3.13
Haaste: Putkiston Luominen
Pyyhkäise näyttääksesi valikon
Tässä haasteessa yhdistä kaikki esikäsittelyvaiheet yhdeksi putkeksi käyttäen alkuperäistä penguins.csv-aineistoa.
- Poista kaksi riviä, joissa on puutteelliset tiedot.
- Rakenna putki, joka sisältää koodauksen, imputoinnin ja skaalaamisen.
Sinun tarvitsee koodata vain kaksi saraketta, 'sex' ja 'island'. Koska et halua koodata koko X:ää, sinun täytyy käyttää ColumnTransformer-luokkaa. Tämän jälkeen käytä SimpleImputer- ja StandardScaler-luokkia koko X:ään.
Tässä muistutuksena make_column_transformer()- ja make_pipeline()-funktiot, joita tulet käyttämään.
Swipe to start coding
Sinulle annetaan DataFrame nimeltä df, joka sisältää pingviinien tietoja.
Tavoitteena on rakentaa esikäsittelyputki, joka käsittelee puuttuvat arvot, koodaa kategoriset sarakkeet ja skaalaa numeeriset ominaisuudet.
- Tuo
make_pipeline-funktio kirjastostasklearn.pipeline. - Luo
ColumnTransformernimeltäct, joka käyttääOneHotEncoder-kooderia sarakkeisiin'sex'ja'island'säilyttäen muut sarakkeet muuttumattomina (remainder='passthrough'). - Luo putki, joka sisältää seuraavat vaiheet järjestyksessä:
- Määrittelemäsi
ColumnTransformer(ct); SimpleImputer, jonka strategiana on'most_frequent';StandardScalerominaisuuksien skaalausta varten.
- Käytä putkea piirre-matriisiin
Xja tallenna muunnetut tiedot muuttujaanX_transformed.
Ratkaisu
Kiitos palautteestasi!
single