Haaste: Kaiken Yhdistäminen
Tässä haasteessa sovelletaan koko kurssilla opittua työnkulkua — datan esikäsittelystä mallin koulutukseen ja arviointiin.





Tehtävä
Swipe to start coding
- Koodaa kohdemuuttuja.
- Jaa data siten, että 33 % käytetään testijoukkona ja loput koulutusjoukkona.
- Luo
ColumnTransformer
, joka koodaa vain'island'
- ja'sex'
-sarakkeet. Varmista, että muut sarakkeet säilyvät muuttumattomina. Käytä sopivaa kooderia nominaalidatalle. - Täydennä
param_grid
niin, että naapureiden määräksi kokeillaan seuraavia arvoja:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Luo
GridSearchCV
-objekti, jossa mallina onKNeighborsClassifier
. - Rakenna putki, joka alkaa
ct
:llä ensimmäisenä askeleena, seuraavana imputointi käyttäen yleisintä arvoa, sitten standardisointi, ja lopuksiGridSearchCV
viimeisenä estimaattorina. - Kouluta malli käyttäen putkea koulutusdatalla.
- Arvioi malli testidatalla. (Tulosta sen pistemäärä)
- Hanki ennustettu kohdemuuttuja
X_test
:lle. - Tulosta paras estimaattori, jonka
grid_search
löysi.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 4. Luku 10
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 3.13
Haaste: Kaiken Yhdistäminen
Pyyhkäise näyttääksesi valikon
Tässä haasteessa sovelletaan koko kurssilla opittua työnkulkua — datan esikäsittelystä mallin koulutukseen ja arviointiin.





Tehtävä
Swipe to start coding
- Koodaa kohdemuuttuja.
- Jaa data siten, että 33 % käytetään testijoukkona ja loput koulutusjoukkona.
- Luo
ColumnTransformer
, joka koodaa vain'island'
- ja'sex'
-sarakkeet. Varmista, että muut sarakkeet säilyvät muuttumattomina. Käytä sopivaa kooderia nominaalidatalle. - Täydennä
param_grid
niin, että naapureiden määräksi kokeillaan seuraavia arvoja:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Luo
GridSearchCV
-objekti, jossa mallina onKNeighborsClassifier
. - Rakenna putki, joka alkaa
ct
:llä ensimmäisenä askeleena, seuraavana imputointi käyttäen yleisintä arvoa, sitten standardisointi, ja lopuksiGridSearchCV
viimeisenä estimaattorina. - Kouluta malli käyttäen putkea koulutusdatalla.
- Arvioi malli testidatalla. (Tulosta sen pistemäärä)
- Hanki ennustettu kohdemuuttuja
X_test
:lle. - Tulosta paras estimaattori, jonka
grid_search
löysi.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!
Awesome!
Completion rate improved to 3.13Osio 4. Luku 10
single