Lære Udfordring: Automatisk Hyperparameterjustering

I stedet for manuelt at vælge specifikke værdier for modellens hyperparametre, tilbyder randomiseret søgning (RandomizedSearchCV) en mere effektiv metode til at finde en optimal konfiguration. I modsætning til grid search (GridSearchCV), som systematisk evaluerer alle mulige kombinationer af hyperparametre, vælger randomiseret søgning et tilfældigt delmængde af disse kombinationer. Denne tilgang reducerer markant de beregningsmæssige omkostninger, samtidig med at der opnås stærke resultater.

For neurale netværk, hvor antallet af mulige hyperparameter-kombinationer kan være enormt, er det ofte upraktisk at teste alle muligheder udtømmende. Randomiseret søgning omgår dette problem ved tilfældigt at udvælge et defineret antal sæt af hyperparametre, hvilket balancerer udforskning og effektivitet.

RandomizedSearchCV(
    estimator=model, 
    param_distributions=randomized_parameters, 
    n_iter=number_of_models_to_test,  # Number of random combinations to evaluate
    scoring='accuracy',  # Evaluation metric
    random_state=42,  # Ensures reproducibility
)

estimator: modellen der skal optimeres (f.eks. MLPClassifier);
param_distributions: en ordbog hvor nøglerne er navne på hyperparametre og værdierne er lister, der skal samples fra;
n_iter: angiver hvor mange tilfældige kombinationer der skal testes. En højere værdi øger sandsynligheden for at finde en optimal kombination, men kræver mere beregning;
scoring: definerer evalueringsmetrikken (f.eks. 'accuracy' for klassifikation).

Opgave

Swipe to start coding

Dit mål er at justere hyperparametrene for en multilayer perceptron (MLP) ved hjælp af RandomizedSearchCV-metoden fra scikit-learn.

Følg disse trin nøje:

Definér parametergrid param_distributions:

'hidden_layer_sizes': inkluder tre konfigurationer — (20, 20), (25, 25), og (30, 30);
'learning_rate_init': inkluder værdierne 0.02, 0.01, og 0.005;
'max_iter': inkluder værdierne 10, 30, og 50.

Initialisér modellen ved at bruge MLPClassifier().
Anvend RandomizedSearchCV:
- Brug den definerede mlp-model som estimator;
- Brug det definerede param_distributions-grid;

Sæt n_iter=4 for at begrænse antallet af parameterkombinationer;
Brug 'accuracy' som evalueringsmetrik;
Sæt random_state=1 for reproducerbarhed.

Fit det randomiserede søg på træningsdataene og udskriv de bedste fundne parametre.
Træn den bedste model på hele træningsdatasættet og evaluer dens nøjagtighed på både trænings- og test-sæt.

Løsning

Var alt klart?

Tak for dine kommentarer!

Sektion 3. Kapitel 3

single

Spørg AI

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain the difference between RandomizedSearchCV and GridSearchCV in more detail?

How do I choose the right number for n_iter in RandomizedSearchCV?

What types of problems is RandomizedSearchCV best suited for?

Awesome!

Completion rate improved to 4

Stryg for at vise menuen

RandomizedSearchCV(
    estimator=model, 
    param_distributions=randomized_parameters, 
    n_iter=number_of_models_to_test,  # Number of random combinations to evaluate
    scoring='accuracy',  # Evaluation metric
    random_state=42,  # Ensures reproducibility
)

estimator: modellen der skal optimeres (f.eks. MLPClassifier);
param_distributions: en ordbog hvor nøglerne er navne på hyperparametre og værdierne er lister, der skal samples fra;
n_iter: angiver hvor mange tilfældige kombinationer der skal testes. En højere værdi øger sandsynligheden for at finde en optimal kombination, men kræver mere beregning;
scoring: definerer evalueringsmetrikken (f.eks. 'accuracy' for klassifikation).