Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Esikäsittelyputki | Piirteiden Suunnittelu Koneoppimista Varten
Datan Esikäsittely ja Ominaisuuksien Rakentaminen

bookHaaste: Esikäsittelyputki

Tehtävä

Swipe to start coding

Sinulle annetaan Titanic-aineisto seaborn-kirjastosta. Tehtävänäsi on rakentaa täydellinen esikäsittelyputki, joka suorittaa kaikki olennaiset tietomuunnokset ennen koneoppimista.

Noudata seuraavia vaiheita:

  1. Lataa aineisto komennolla sns.load_dataset("titanic").
  2. Käsittele puuttuvat arvot:
  • Numeeriset sarakkeet → täytä keskiarvolla.
  • Kategoriset sarakkeet → täytä moodilla.
  1. Koodaa kategoriset muuttujat sex ja embarked käyttäen pd.get_dummies().
  2. Skaalaa numeeriset sarakkeet age ja fare käyttäen StandardScaler.
  3. Luo uusi ominaisuus family_size = sibsp + parch + 1.
  4. Yhdistä kaikki muunnokset funktioon nimeltä preprocess_titanic(data), joka palauttaa lopullisen käsitellyn DataFrame-olion.
  5. Aseta käsitelty aineisto muuttujaan nimeltä processed_data.

Tulosta lopullisen DataFrame-olion ensimmäiset 5 riviä.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 4
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 8.33

bookHaaste: Esikäsittelyputki

Pyyhkäise näyttääksesi valikon

Tehtävä

Swipe to start coding

Sinulle annetaan Titanic-aineisto seaborn-kirjastosta. Tehtävänäsi on rakentaa täydellinen esikäsittelyputki, joka suorittaa kaikki olennaiset tietomuunnokset ennen koneoppimista.

Noudata seuraavia vaiheita:

  1. Lataa aineisto komennolla sns.load_dataset("titanic").
  2. Käsittele puuttuvat arvot:
  • Numeeriset sarakkeet → täytä keskiarvolla.
  • Kategoriset sarakkeet → täytä moodilla.
  1. Koodaa kategoriset muuttujat sex ja embarked käyttäen pd.get_dummies().
  2. Skaalaa numeeriset sarakkeet age ja fare käyttäen StandardScaler.
  3. Luo uusi ominaisuus family_size = sibsp + parch + 1.
  4. Yhdistä kaikki muunnokset funktioon nimeltä preprocess_titanic(data), joka palauttaa lopullisen käsitellyn DataFrame-olion.
  5. Aseta käsitelty aineisto muuttujaan nimeltä processed_data.

Tulosta lopullisen DataFrame-olion ensimmäiset 5 riviä.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 4
single

single

some-alt