Leer Gridsearchcv | Modellering

Veeg om het menu te tonen

Om de modelprestaties te verbeteren, worden hyperparameters afgestemd. Het idee is eenvoudig: verschillende waarden testen, kruisvalidatiescores berekenen en de waarde met de hoogste score kiezen.

Dit proces kan worden uitgevoerd met de GridSearchCV-klasse uit de module sklearn.model_selection.

GridSearchCV vereist een model en een parameterrooster (param_grid). Voorbeeld:

param_grid = {'n_neighbors': [1, 3, 5, 7]}

Na het initialiseren van GridSearchCV, .fit(X, y) aanroepen.

Het beste model bevindt zich in .best_estimator_;
De kruisvalidatiescore staat in .best_score_.


              12345678910111213
            
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import GridSearchCV

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_pipelined.csv')
X, y = df.drop('species', axis=1), df['species']

param_grid = {'n_neighbors': [1,3,5,7,9]}
grid_search = GridSearchCV(KNeighborsClassifier(), param_grid)
grid_search.fit(X, y)

print(grid_search.best_estimator_)
print(grid_search.best_score_)

Na het trainen past GridSearchCV automatisch de beste estimator opnieuw toe op de volledige dataset. Het grid_search-object wordt het uiteindelijke getrainde model en kan direct worden gebruikt met .predict() en .score().


              12
            
grid_search.fit(X, y)
print(grid_search.score(X, y))   # training accuracy (not reliable for real evaluation)

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 4. Hoofdstuk 6

Vraag AI

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Sectie 4. Hoofdstuk 6