Utmaning: Sätta Ihop Allt
I denna utmaning tillämpas hela arbetsflödet som lärts ut i kursen — från datapreprocessering till träning och modelevaluering.





Swipe to start coding
Du har fått en dataset med pingviner. Ditt mål är att bygga en maskininlärningspipeline som klassificerar pingvinarter med hjälp av en K-Nearest Neighbors (KNN)-modell, samtidigt som du hanterar kodning, saknade värden och parameteroptimering på rätt sätt.
- Koda målvariabeln med
LabelEncoder
. - Dela upp datasetet i tränings- och testdata med
test_size=0.33
. - Skapa en ColumnTransformer (
ct
) som endast kodar kolumnerna'island'
och'sex'
med en lämplig kodare för nominaldata (OneHotEncoder
) och lämnar övriga kolumner oförändrade. - Definiera ett parameterraster (
param_grid
) som inkluderar följande värden förn_neighbors
:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Skapa ett
GridSearchCV
-objekt medKNeighborsClassifier
som basmodell ochparam_grid
som dess parametrar. - Bygg en pipeline bestående av:
ColumnTransformer
(ct
);- en
SimpleImputer
(strategi ='most_frequent'
); - en
StandardScaler
; - och
GridSearchCV
som sista steg.
- Träna pipelinen med träningsdata (
X_train
,y_train
). - Utvärdera modellen på testdata genom att skriva ut dess
.score(X_test, y_test)
. - Förutsäg på testmängden och skriv ut de första 5 avkodade förutsägelserna med
label_enc.inverse_transform()
. - Skriv slutligen ut den bästa estimatormodellen som hittats av
GridSearchCV
.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Can you provide the dataset we'll be working with?
What type of model should I use for this challenge?
Could you outline the specific steps involved in the workflow?
Awesome!
Completion rate improved to 3.13
Utmaning: Sätta Ihop Allt
Svep för att visa menyn
I denna utmaning tillämpas hela arbetsflödet som lärts ut i kursen — från datapreprocessering till träning och modelevaluering.





Swipe to start coding
Du har fått en dataset med pingviner. Ditt mål är att bygga en maskininlärningspipeline som klassificerar pingvinarter med hjälp av en K-Nearest Neighbors (KNN)-modell, samtidigt som du hanterar kodning, saknade värden och parameteroptimering på rätt sätt.
- Koda målvariabeln med
LabelEncoder
. - Dela upp datasetet i tränings- och testdata med
test_size=0.33
. - Skapa en ColumnTransformer (
ct
) som endast kodar kolumnerna'island'
och'sex'
med en lämplig kodare för nominaldata (OneHotEncoder
) och lämnar övriga kolumner oförändrade. - Definiera ett parameterraster (
param_grid
) som inkluderar följande värden förn_neighbors
:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Skapa ett
GridSearchCV
-objekt medKNeighborsClassifier
som basmodell ochparam_grid
som dess parametrar. - Bygg en pipeline bestående av:
ColumnTransformer
(ct
);- en
SimpleImputer
(strategi ='most_frequent'
); - en
StandardScaler
; - och
GridSearchCV
som sista steg.
- Träna pipelinen med träningsdata (
X_train
,y_train
). - Utvärdera modellen på testdata genom att skriva ut dess
.score(X_test, y_test)
. - Förutsäg på testmängden och skriv ut de första 5 avkodade förutsägelserna med
label_enc.inverse_transform()
. - Skriv slutligen ut den bästa estimatormodellen som hittats av
GridSearchCV
.
Lösning
Tack för dina kommentarer!
single