Gridsearchcv
Mallin suorituskyvyn parantamiseksi säädetään hyperparametreja. Ajatus on yksinkertainen: testataan eri arvoja, lasketaan ristiinvalidointipisteet ja valitaan se, jolla on korkein pistemäärä.
Tämä prosessi voidaan toteuttaa käyttämällä GridSearchCV-luokkaa, joka löytyy sklearn.model_selection -moduulista.
GridSearchCV vaatii mallin ja parametriverkon (param_grid).
Esimerkki:
param_grid = {'n_neighbors': [1, 3, 5, 7]}
Kun GridSearchCV on alustettu, kutsutaan .fit(X, y).
- Paras malli löytyy kentästä
.best_estimator_; - Sen ristiinvalidointipisteet löytyvät kentästä
.best_score_.
12345678910111213import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import GridSearchCV df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_pipelined.csv') X, y = df.drop('species', axis=1), df['species'] param_grid = {'n_neighbors': [1,3,5,7,9]} grid_search = GridSearchCV(KNeighborsClassifier(), param_grid) grid_search.fit(X, y) print(grid_search.best_estimator_) print(grid_search.best_score_)
Sovituksen jälkeen GridSearchCV kouluttaa automaattisesti parhaan estimaattorin koko aineistolla.
grid_search-objekti toimii lopullisena koulutettuna mallina ja sitä voidaan käyttää suoraan metodeilla .predict() ja .score().
12grid_search.fit(X, y) print(grid_search.score(X, y)) # training accuracy (not reliable for real evaluation)
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain what a parameter grid is and how to choose its values?
How does GridSearchCV perform cross-validation?
What does the best_estimator_ attribute represent?
Awesome!
Completion rate improved to 3.13
Gridsearchcv
Pyyhkäise näyttääksesi valikon
Mallin suorituskyvyn parantamiseksi säädetään hyperparametreja. Ajatus on yksinkertainen: testataan eri arvoja, lasketaan ristiinvalidointipisteet ja valitaan se, jolla on korkein pistemäärä.
Tämä prosessi voidaan toteuttaa käyttämällä GridSearchCV-luokkaa, joka löytyy sklearn.model_selection -moduulista.
GridSearchCV vaatii mallin ja parametriverkon (param_grid).
Esimerkki:
param_grid = {'n_neighbors': [1, 3, 5, 7]}
Kun GridSearchCV on alustettu, kutsutaan .fit(X, y).
- Paras malli löytyy kentästä
.best_estimator_; - Sen ristiinvalidointipisteet löytyvät kentästä
.best_score_.
12345678910111213import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import GridSearchCV df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_pipelined.csv') X, y = df.drop('species', axis=1), df['species'] param_grid = {'n_neighbors': [1,3,5,7,9]} grid_search = GridSearchCV(KNeighborsClassifier(), param_grid) grid_search.fit(X, y) print(grid_search.best_estimator_) print(grid_search.best_score_)
Sovituksen jälkeen GridSearchCV kouluttaa automaattisesti parhaan estimaattorin koko aineistolla.
grid_search-objekti toimii lopullisena koulutettuna mallina ja sitä voidaan käyttää suoraan metodeilla .predict() ja .score().
12grid_search.fit(X, y) print(grid_search.score(X, y)) # training accuracy (not reliable for real evaluation)
Kiitos palautteestasi!