Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Kaiken Yhdistäminen | Mallintaminen
Koneoppimisen Perusteet Scikit-learnilla

bookHaaste: Kaiken Yhdistäminen

Tässä haasteessa sovelletaan koko kurssilla opittua työnkulkua — aina datan esikäsittelystä mallin koulutukseen ja arviointiin asti.

Tehtävä

Swipe to start coding

Sinulle annetaan pingviinien tietoaineisto. Tavoitteena on rakentaa koneoppimisputki, joka luokittelee pingviinilajit käyttäen K-lähimmän naapurin (KNN) mallia, käsitellen asianmukaisesti koodauksen, puuttuvat arvot ja parametrien optimoinnin.

  1. Koodaa kohdemuuttuja käyttäen LabelEncoder-luokkaa.
  2. Jaa tietoaineisto koulutus- ja testijoukkoihin käyttäen test_size=0.33.
  3. Luo ColumnTransformer (ct), joka koodaa vain 'island'- ja 'sex'-sarakkeet käyttäen sopivaa kooderia nominaalidatalle (OneHotEncoder) ja jättää muut sarakkeet koskemattomiksi.
  4. Määritä parametriverkko (param_grid), joka sisältää seuraavat arvot n_neighbors-parametrille: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Luo GridSearchCV-olio, jossa KNeighborsClassifier toimii perusmallina ja param_grid sen parametreina.
  6. Rakenna putki, joka koostuu:
  • ColumnTransformerista (ct);
  • SimpleImputerista (strategia = 'most_frequent');
  • StandardScalerista;
  • ja GridSearchCV:stä viimeisenä vaiheena.
  1. Kouluta putki käyttäen koulutusdataa (X_train, y_train).
  2. Arvioi mallia testidatalla tulostamalla sen .score(X_test, y_test).
  3. Ennusta testijoukolla ja tulosta ensimmäiset 5 dekoodattua ennustetta käyttäen label_enc.inverse_transform().
  4. Lopuksi tulosta paras estimointimalli, jonka GridSearchCV löysi.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 10
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain the steps involved in the full workflow shown here?

What is the purpose of each tool or method depicted in the images?

Can you provide a summary of how these components work together in a machine learning project?

close

Awesome!

Completion rate improved to 3.13

bookHaaste: Kaiken Yhdistäminen

Pyyhkäise näyttääksesi valikon

Tässä haasteessa sovelletaan koko kurssilla opittua työnkulkua — aina datan esikäsittelystä mallin koulutukseen ja arviointiin asti.

Tehtävä

Swipe to start coding

Sinulle annetaan pingviinien tietoaineisto. Tavoitteena on rakentaa koneoppimisputki, joka luokittelee pingviinilajit käyttäen K-lähimmän naapurin (KNN) mallia, käsitellen asianmukaisesti koodauksen, puuttuvat arvot ja parametrien optimoinnin.

  1. Koodaa kohdemuuttuja käyttäen LabelEncoder-luokkaa.
  2. Jaa tietoaineisto koulutus- ja testijoukkoihin käyttäen test_size=0.33.
  3. Luo ColumnTransformer (ct), joka koodaa vain 'island'- ja 'sex'-sarakkeet käyttäen sopivaa kooderia nominaalidatalle (OneHotEncoder) ja jättää muut sarakkeet koskemattomiksi.
  4. Määritä parametriverkko (param_grid), joka sisältää seuraavat arvot n_neighbors-parametrille: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Luo GridSearchCV-olio, jossa KNeighborsClassifier toimii perusmallina ja param_grid sen parametreina.
  6. Rakenna putki, joka koostuu:
  • ColumnTransformerista (ct);
  • SimpleImputerista (strategia = 'most_frequent');
  • StandardScalerista;
  • ja GridSearchCV:stä viimeisenä vaiheena.
  1. Kouluta putki käyttäen koulutusdataa (X_train, y_train).
  2. Arvioi mallia testidatalla tulostamalla sen .score(X_test, y_test).
  3. Ennusta testijoukolla ja tulosta ensimmäiset 5 dekoodattua ennustetta käyttäen label_enc.inverse_transform().
  4. Lopuksi tulosta paras estimointimalli, jonka GridSearchCV löysi.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 10
single

single

some-alt