Ricerca a Griglia Cv
Per migliorare le prestazioni del modello, si regolano gli iperparametri. L'idea è semplice: testare diversi valori, calcolare i punteggi di validazione incrociata e scegliere quello con il punteggio più alto.
Questo processo può essere eseguito utilizzando la classe GridSearchCV del modulo sklearn.model_selection.
GridSearchCV richiede un modello e una griglia di parametri (param_grid).
Esempio:
param_grid = {'n_neighbors': [1, 3, 5, 7]}
Dopo aver inizializzato GridSearchCV, chiamare .fit(X, y).
- Il modello migliore si trova in
.best_estimator_; - Il suo punteggio di validazione incrociata è in
.best_score_.
12345678910111213import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import GridSearchCV df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_pipelined.csv') X, y = df.drop('species', axis=1), df['species'] param_grid = {'n_neighbors': [1,3,5,7,9]} grid_search = GridSearchCV(KNeighborsClassifier(), param_grid) grid_search.fit(X, y) print(grid_search.best_estimator_) print(grid_search.best_score_)
Dopo l'addestramento, GridSearchCV riaddestra automaticamente il miglior stimatore sull'intero set di dati.
L'oggetto grid_search diventa il modello finale addestrato e può essere utilizzato direttamente con .predict() e .score().
12grid_search.fit(X, y) print(grid_search.score(X, y)) # training accuracy (not reliable for real evaluation)
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 3.13
Ricerca a Griglia Cv
Scorri per mostrare il menu
Per migliorare le prestazioni del modello, si regolano gli iperparametri. L'idea è semplice: testare diversi valori, calcolare i punteggi di validazione incrociata e scegliere quello con il punteggio più alto.
Questo processo può essere eseguito utilizzando la classe GridSearchCV del modulo sklearn.model_selection.
GridSearchCV richiede un modello e una griglia di parametri (param_grid).
Esempio:
param_grid = {'n_neighbors': [1, 3, 5, 7]}
Dopo aver inizializzato GridSearchCV, chiamare .fit(X, y).
- Il modello migliore si trova in
.best_estimator_; - Il suo punteggio di validazione incrociata è in
.best_score_.
12345678910111213import pandas as pd from sklearn.neighbors import KNeighborsClassifier from sklearn.model_selection import GridSearchCV df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_pipelined.csv') X, y = df.drop('species', axis=1), df['species'] param_grid = {'n_neighbors': [1,3,5,7,9]} grid_search = GridSearchCV(KNeighborsClassifier(), param_grid) grid_search.fit(X, y) print(grid_search.best_estimator_) print(grid_search.best_score_)
Dopo l'addestramento, GridSearchCV riaddestra automaticamente il miglior stimatore sull'intero set di dati.
L'oggetto grid_search diventa il modello finale addestrato e può essere utilizzato direttamente con .predict() e .score().
12grid_search.fit(X, y) print(grid_search.score(X, y)) # training accuracy (not reliable for real evaluation)
Grazie per i tuoi commenti!