Haaste: Kaiken Yhdistäminen
Tässä haasteessa sovelletaan koko kurssilla opittua työnkulkua — datan esikäsittelystä mallin koulutukseen ja arviointiin.





Tehtävä
Swipe to start coding
- Koodaa kohdemuuttuja.
- Jaa data siten, että 33 % käytetään testijoukkona ja loput koulutusjoukkona.
- Luo
ColumnTransformer
, joka koodaa vain'island'
- ja'sex'
-sarakkeet. Varmista, että muut sarakkeet säilyvät muuttumattomina. Käytä sopivaa kooderia nominaalidatalle. - Täydennä
param_grid
niin, että naapureiden määräksi kokeillaan seuraavia arvoja:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Luo
GridSearchCV
-objekti, jossa mallina onKNeighborsClassifier
. - Rakenna putki, joka alkaa
ct
:llä ensimmäisenä askeleena, seuraavana imputointi käyttäen yleisintä arvoa, sitten standardisointi, ja lopuksiGridSearchCV
viimeisenä estimaattorina. - Kouluta malli käyttäen putkea koulutusdatalla.
- Arvioi malli testidatalla. (Tulosta sen pistemäärä)
- Hanki ennustettu kohdemuuttuja
X_test
:lle. - Tulosta paras estimaattori, jonka
grid_search
löysi.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 4. Luku 10
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Suggested prompts:
Can you provide the dataset we'll be working with?
What type of model should I use for this challenge?
Could you outline the specific steps involved in the workflow?
Awesome!
Completion rate improved to 3.13
Haaste: Kaiken Yhdistäminen
Pyyhkäise näyttääksesi valikon
Tässä haasteessa sovelletaan koko kurssilla opittua työnkulkua — datan esikäsittelystä mallin koulutukseen ja arviointiin.





Tehtävä
Swipe to start coding
- Koodaa kohdemuuttuja.
- Jaa data siten, että 33 % käytetään testijoukkona ja loput koulutusjoukkona.
- Luo
ColumnTransformer
, joka koodaa vain'island'
- ja'sex'
-sarakkeet. Varmista, että muut sarakkeet säilyvät muuttumattomina. Käytä sopivaa kooderia nominaalidatalle. - Täydennä
param_grid
niin, että naapureiden määräksi kokeillaan seuraavia arvoja:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Luo
GridSearchCV
-objekti, jossa mallina onKNeighborsClassifier
. - Rakenna putki, joka alkaa
ct
:llä ensimmäisenä askeleena, seuraavana imputointi käyttäen yleisintä arvoa, sitten standardisointi, ja lopuksiGridSearchCV
viimeisenä estimaattorina. - Kouluta malli käyttäen putkea koulutusdatalla.
- Arvioi malli testidatalla. (Tulosta sen pistemäärä)
- Hanki ennustettu kohdemuuttuja
X_test
:lle. - Tulosta paras estimaattori, jonka
grid_search
löysi.
Ratkaisu
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 4. Luku 10
single