Gridsearchcv
Om de modelprestaties te verbeteren, worden hyperparameters afgestemd. Het idee is eenvoudig: verschillende waarden testen, kruisvalidatiescores berekenen en de waarde met de hoogste score kiezen.
Dit proces kan worden uitgevoerd met de GridSearchCV-klasse uit de module sklearn.model_selection.
GridSearchCV vereist een model en een parameterrooster (param_grid).
Voorbeeld:
param_grid = {'n_neighbors': [1, 3, 5, 7]}
Na het initialiseren van GridSearchCV, .fit(X, y) aanroepen.
- Het beste model bevindt zich in
.best_estimator_; - De kruisvalidatiescore staat in
.best_score_.
12345678910111213import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import GridSearchCV df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_pipelined.csv') X, y = df.drop('species', axis=1), df['species'] param_grid = {'n_neighbors': [1,3,5,7,9]} grid_search = GridSearchCV(KNeighborsClassifier(), param_grid) grid_search.fit(X, y) print(grid_search.best_estimator_) print(grid_search.best_score_)
Na het trainen past GridSearchCV automatisch de beste estimator opnieuw toe op de volledige dataset.
Het grid_search-object wordt het uiteindelijke getrainde model en kan direct worden gebruikt met .predict() en .score().
12grid_search.fit(X, y) print(grid_search.score(X, y)) # training accuracy (not reliable for real evaluation)
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Can you explain what a parameter grid is and how to choose its values?
How does GridSearchCV perform cross-validation?
What does the best_estimator_ attribute represent?
Awesome!
Completion rate improved to 3.13
Gridsearchcv
Veeg om het menu te tonen
Om de modelprestaties te verbeteren, worden hyperparameters afgestemd. Het idee is eenvoudig: verschillende waarden testen, kruisvalidatiescores berekenen en de waarde met de hoogste score kiezen.
Dit proces kan worden uitgevoerd met de GridSearchCV-klasse uit de module sklearn.model_selection.
GridSearchCV vereist een model en een parameterrooster (param_grid).
Voorbeeld:
param_grid = {'n_neighbors': [1, 3, 5, 7]}
Na het initialiseren van GridSearchCV, .fit(X, y) aanroepen.
- Het beste model bevindt zich in
.best_estimator_; - De kruisvalidatiescore staat in
.best_score_.
12345678910111213import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import GridSearchCV df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_pipelined.csv') X, y = df.drop('species', axis=1), df['species'] param_grid = {'n_neighbors': [1,3,5,7,9]} grid_search = GridSearchCV(KNeighborsClassifier(), param_grid) grid_search.fit(X, y) print(grid_search.best_estimator_) print(grid_search.best_score_)
Na het trainen past GridSearchCV automatisch de beste estimator opnieuw toe op de volledige dataset.
Het grid_search-object wordt het uiteindelijke getrainde model en kan direct worden gebruikt met .predict() en .score().
12grid_search.fit(X, y) print(grid_search.score(X, y)) # training accuracy (not reliable for real evaluation)
Bedankt voor je feedback!