Uitdaging: Alles Samenbrengen
In deze uitdaging past u alles toe wat u tijdens de cursus heeft geleerd, van gegevensvoorbewerking tot het trainen en evalueren van het model.





Taak
Swipe to start coding
- Doelvariabele coderen.
- Gegevens splitsen zodat 33% wordt gebruikt voor de testset en de rest voor de trainingsset.
- Een
ColumnTransformer
maken om alleen de kolommen'island'
en'sex'
te coderen. Zorg ervoor dat de andere kolommen onaangetast blijven. Gebruik een geschikte encoder voor nominale gegevens. - Vul de ontbrekende waarden in een
param_grid
aan om de volgende waarden voor het aantal buren te proberen:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Maak een
GridSearchCV
-object met deKNeighborsClassifier
als model. - Stel een pipeline samen die begint met
ct
als eerste stap, gevolgd door imputatie met de meest voorkomende waarde, standaardisatie, en eindigt metGridSearchCV
als laatste estimator. - Train het model met behulp van een pipeline op de trainingsset.
- Evalueer het model op de testset. (Print de score)
- Verkrijg een voorspelde doelvariabele voor
X_test
. - Print de beste estimator gevonden door
grid_search
.
Oplossing
Was alles duidelijk?
Bedankt voor je feedback!
Sectie 4. Hoofdstuk 10
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 3.13
Uitdaging: Alles Samenbrengen
Veeg om het menu te tonen
In deze uitdaging past u alles toe wat u tijdens de cursus heeft geleerd, van gegevensvoorbewerking tot het trainen en evalueren van het model.





Taak
Swipe to start coding
- Doelvariabele coderen.
- Gegevens splitsen zodat 33% wordt gebruikt voor de testset en de rest voor de trainingsset.
- Een
ColumnTransformer
maken om alleen de kolommen'island'
en'sex'
te coderen. Zorg ervoor dat de andere kolommen onaangetast blijven. Gebruik een geschikte encoder voor nominale gegevens. - Vul de ontbrekende waarden in een
param_grid
aan om de volgende waarden voor het aantal buren te proberen:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Maak een
GridSearchCV
-object met deKNeighborsClassifier
als model. - Stel een pipeline samen die begint met
ct
als eerste stap, gevolgd door imputatie met de meest voorkomende waarde, standaardisatie, en eindigt metGridSearchCV
als laatste estimator. - Train het model met behulp van een pipeline op de trainingsset.
- Evalueer het model op de testset. (Print de score)
- Verkrijg een voorspelde doelvariabele voor
X_test
. - Print de beste estimator gevonden door
grid_search
.
Oplossing
Was alles duidelijk?
Bedankt voor je feedback!
Awesome!
Completion rate improved to 3.13Sectie 4. Hoofdstuk 10
single