Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Kategoristen Muuttujien Koodaus | Datan Esikäsittely Scikit-learnilla
Johdatus koneoppimiseen Pythonilla

bookHaaste: Kategoristen Muuttujien Koodaus

Yhteenvetona edellisistä kolmesta luvusta, alla on taulukko, joka näyttää, mitä enkooderia tulisi käyttää:

Tässä haasteessa käytössä on penguins-aineisto (ilman puuttuvia arvoja). Kaikki kategoriset ominaisuudet, mukaan lukien kohde ('species'-sarake), tulee koodata.

Tässä muistutuksena aineiston rakenne:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Huomaa, että 'island' ja 'sex' ovat kategorisia piirteitä ja 'species' on kategorinen kohde.

Tehtävä

Swipe to start coding

Sinulle annetaan DataFrame nimeltä df, joka sisältää pingviinien tietoja.
Tehtävänäsi on koodata kaikki kategoriset ominaisuudet, jotta dataa voidaan käyttää koneoppimismallissa.

  1. Tuo OneHotEncoder- ja LabelEncoder-luokat sklearn.preprocessing-kirjastosta.
  2. Erottele ominaisuusmatriisi X ja kohdemuuttuja y DataFramesta.
  3. Luo OneHotEncoder-olio ja käytä sitä 'island':n 'sex'- ja X-sarakkeisiin.
  4. Korvaa alkuperäiset kategoriset sarakkeet koodatuilla arvoilla.
  5. Luo LabelEncoder-olio ja käytä sitä 'species'-sarakkeeseen kohdemuuttujan y koodaamiseksi.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 8
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 3.13

bookHaaste: Kategoristen Muuttujien Koodaus

Pyyhkäise näyttääksesi valikon

Yhteenvetona edellisistä kolmesta luvusta, alla on taulukko, joka näyttää, mitä enkooderia tulisi käyttää:

Tässä haasteessa käytössä on penguins-aineisto (ilman puuttuvia arvoja). Kaikki kategoriset ominaisuudet, mukaan lukien kohde ('species'-sarake), tulee koodata.

Tässä muistutuksena aineiston rakenne:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Huomaa, että 'island' ja 'sex' ovat kategorisia piirteitä ja 'species' on kategorinen kohde.

Tehtävä

Swipe to start coding

Sinulle annetaan DataFrame nimeltä df, joka sisältää pingviinien tietoja.
Tehtävänäsi on koodata kaikki kategoriset ominaisuudet, jotta dataa voidaan käyttää koneoppimismallissa.

  1. Tuo OneHotEncoder- ja LabelEncoder-luokat sklearn.preprocessing-kirjastosta.
  2. Erottele ominaisuusmatriisi X ja kohdemuuttuja y DataFramesta.
  3. Luo OneHotEncoder-olio ja käytä sitä 'island':n 'sex'- ja X-sarakkeisiin.
  4. Korvaa alkuperäiset kategoriset sarakkeet koodatuilla arvoilla.
  5. Luo LabelEncoder-olio ja käytä sitä 'species'-sarakkeeseen kohdemuuttujan y koodaamiseksi.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 8
single

single

some-alt