Impara Sfida: Ottimizzazione Automatica degli Iperparametri

Piuttosto che selezionare manualmente valori specifici per gli iperparametri del modello, la ricerca randomizzata (RandomizedSearchCV) offre un modo più efficiente per individuare una configurazione ottimale. A differenza della ricerca a griglia (GridSearchCV), che valuta sistematicamente tutte le possibili combinazioni di iperparametri, la ricerca randomizzata seleziona un sottoinsieme casuale di queste combinazioni. Questo approccio riduce significativamente il costo computazionale, pur garantendo risultati solidi.

Per le reti neurali, dove il numero di possibili combinazioni di iperparametri può essere enorme, testare esaustivamente ogni opzione è spesso impraticabile. La ricerca randomizzata aggira questo problema campionando casualmente un numero definito di set di iperparametri, bilanciando esplorazione ed efficienza.

RandomizedSearchCV(
    estimator=model, 
    param_distributions=randomized_parameters, 
    n_iter=number_of_models_to_test,  # Number of random combinations to evaluate
    scoring='accuracy',  # Evaluation metric
    random_state=42,  # Ensures reproducibility
)

estimator: modello da ottimizzare (ad esempio, MLPClassifier);
param_distributions: dizionario in cui le chiavi sono i nomi degli iperparametri e i valori sono le liste da cui campionare;
n_iter: specifica quante combinazioni casuali devono essere testate. Un valore più alto aumenta le probabilità di trovare una combinazione ottimale ma richiede più calcolo;
scoring: definisce la metrica di valutazione (ad esempio, 'accuracy' per la classificazione).

Compito

Swipe to start coding

L'obiettivo è ottimizzare gli iperparametri di un multilayer perceptron (MLP) utilizzando il metodo RandomizedSearchCV di scikit-learn.

Seguire attentamente questi passaggi:

Definire la griglia dei parametri param_distributions:

'hidden_layer_sizes': includere tre configurazioni — (20, 20), (25, 25) e (30, 30);
'learning_rate_init': includere i valori 0.02, 0.01 e 0.005;
'max_iter': includere i valori 10, 30 e 50.

Inizializzare il modello utilizzando MLPClassifier().
Applicare RandomizedSearchCV:

Utilizzare il modello mlp definito come stimatore;
Utilizzare la griglia param_distributions definita;
Impostare n_iter=4 per limitare il numero di combinazioni di parametri;
Utilizzare 'accuracy' come metrica di valutazione;
Impostare random_state=1 per la riproducibilità.

Eseguire il fitting della ricerca randomizzata sui dati di addestramento e stampare i migliori parametri trovati.
Addestrare il miglior modello sull'intero set di dati di addestramento e valutarne l'accuratezza sia sul set di addestramento che su quello di test.

Soluzione

Tutto è chiaro?

Grazie per i tuoi commenti!

Sezione 3. Capitolo 3

single

Chieda ad AI

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

Can you explain the difference between RandomizedSearchCV and GridSearchCV in more detail?

How do I choose the right number for n_iter in RandomizedSearchCV?

What types of problems is RandomizedSearchCV best suited for?

Awesome!

Completion rate improved to 4

Scorri per mostrare il menu

RandomizedSearchCV(
    estimator=model, 
    param_distributions=randomized_parameters, 
    n_iter=number_of_models_to_test,  # Number of random combinations to evaluate
    scoring='accuracy',  # Evaluation metric
    random_state=42,  # Ensures reproducibility
)

estimator: modello da ottimizzare (ad esempio, MLPClassifier);
param_distributions: dizionario in cui le chiavi sono i nomi degli iperparametri e i valori sono le liste da cui campionare;
n_iter: specifica quante combinazioni casuali devono essere testate. Un valore più alto aumenta le probabilità di trovare una combinazione ottimale ma richiede più calcolo;
scoring: definisce la metrica di valutazione (ad esempio, 'accuracy' per la classificazione).