Riepilogo della Modellazione
Scorri per mostrare il menu
Ora sai come costruire un modello, utilizzare le pipeline e ottimizzare gli iperparametri. Hai anche appreso due metodi di valutazione: suddivisione train-test e cross-validation.
Il passo successivo è combinare valutazione e ottimizzazione utilizzando GridSearchCV o RandomizedSearchCV.
Poiché il nostro dataset è molto piccolo, utilizzeremo il GridSearchCV, ma tutto ciò che segue si applica anche a un RandomizedSearchCV.
Poiché la cross-validation è più stabile rispetto a una singola suddivisione train-test, l'obiettivo è ottenere il punteggio di cross-validation più alto.
GridSearchCV esplora gli iperparametri e trova quelli che massimizzano questo punteggio. Il punteggio migliore viene memorizzato in .best_score_.
Gli iperparametri che funzionano meglio per un dataset potrebbero non generalizzare quando arrivano nuovi dati.
Pertanto, .best_score_ può essere superiore rispetto alle prestazioni del modello su dati completamente nuovi.
Flusso di lavoro comune: suddivisione in set di addestramento e di test; esecuzione della cross-validation sul set di addestramento per ottimizzare il modello; successiva valutazione del modello ottimizzato sul set di test per misurare le prestazioni nel mondo reale.
Per riassumere:
- Pre-elaborazione dei dati;
- Suddivisione in set di addestramento e di test;
- Utilizzo della cross-validazione sul set di addestramento per trovare la configurazione migliore;
- Valutazione sul set di test.
Il terzo passaggio di solito prevede il test di molteplici algoritmi e la regolazione dei loro iperparametri per identificare l'opzione migliore. Per semplicità, in questo corso è stato utilizzato un solo algoritmo.
La cross-validazione non è sempre l'opzione migliore. Per dataset di grandi dimensioni, il calcolo dei punteggi CV diventa oneroso, mentre una suddivisione train-test risulta più stabile grazie all'ampio set di test.
I grandi dataset vengono spesso suddivisi in training, validation e test set. Gli iperparametri vengono scelti in base alle prestazioni sul validation set. Infine, il modello selezionato viene valutato sul test set per verificare quanto bene generalizza.
Il penguins dataset è di piccole dimensioni, con solo 342 istanze. A causa di questa dimensione limitata, nel prossimo capitolo verrà utilizzato il punteggio di cross-validation per la valutazione.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione