Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Automaattinen Hyperparametrien Viritys | Yhteenveto
Johdatus neuroverkkoihin

bookHaaste: Automaattinen Hyperparametrien Viritys

Sen sijaan, että valittaisiin mallin hyperparametrien arvot manuaalisesti, satunnaishaku (RandomizedSearchCV) tarjoaa tehokkaamman tavan löytää optimaalinen kokoonpano. Toisin kuin ruutuhaku (GridSearchCV), joka arvioi järjestelmällisesti kaikki mahdolliset hyperparametriyhdistelmät, satunnaishaku valitsee satunnaisen osajoukon näistä yhdistelmistä. Tämä lähestymistapa vähentää merkittävästi laskentakustannuksia ja tuottaa silti hyviä tuloksia.

Neuroverkoissa mahdollisten hyperparametriyhdistelmien määrä voi olla valtava, joten kaikkien vaihtoehtojen läpikäynti on usein epäkäytännöllistä. Satunnaishaku ratkaisee tämän ongelman arpomalla ennalta määritellyn määrän hyperparametrisettejä, tasapainottaen tutkimisen ja tehokkuuden.

RandomizedSearchCV(
    estimator=model, 
    param_distributions=randomized_parameters, 
    n_iter=number_of_models_to_test,  # Number of random combinations to evaluate
    scoring='accuracy',  # Evaluation metric
    random_state=42,  # Ensures reproducibility
)
  • estimator: optimoitava malli (esim. MLPClassifier);
  • param_distributions: sanakirja, jossa avaimina ovat hyperparametrien nimet ja arvoina listat, joista arvot arvotaan;
  • n_iter: määrittää, kuinka monta satunnaista yhdistelmää testataan. Suurempi arvo lisää optimaalisen yhdistelmän löytymisen todennäköisyyttä, mutta vaatii enemmän laskentaa;
  • scoring: määrittää arviointimetriikan (esim. 'accuracy' luokittelussa).
Tehtävä

Swipe to start coding

  1. param_distributions-sanakirjassa luo arvot kahdelle piilotetulle kerrokselle, joissa kummassakin kerroksessa on sama määrä neuroneita, välillä 2030 (mukaan lukien), askelin 2.
  2. param_distributions-sanakirjassa aseta oppimisnopeuden arvot: 0.02, 0.01 ja 0.005.
  3. param_distributions-sanakirjassa luo satunnaisia arvoja opetusepookkien määrälle välillä 1050 (poissulkeva), yhteensä 10 arvoa.
  4. Käytä satunnaistettua hakua 4 iteraatiolla (arvioitavien hyperparametriyhdistelmien määrä) ja käytä tarkkuutta arviointimetriikkana.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 3
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

close

Awesome!

Completion rate improved to 4

bookHaaste: Automaattinen Hyperparametrien Viritys

Pyyhkäise näyttääksesi valikon

Sen sijaan, että valittaisiin mallin hyperparametrien arvot manuaalisesti, satunnaishaku (RandomizedSearchCV) tarjoaa tehokkaamman tavan löytää optimaalinen kokoonpano. Toisin kuin ruutuhaku (GridSearchCV), joka arvioi järjestelmällisesti kaikki mahdolliset hyperparametriyhdistelmät, satunnaishaku valitsee satunnaisen osajoukon näistä yhdistelmistä. Tämä lähestymistapa vähentää merkittävästi laskentakustannuksia ja tuottaa silti hyviä tuloksia.

Neuroverkoissa mahdollisten hyperparametriyhdistelmien määrä voi olla valtava, joten kaikkien vaihtoehtojen läpikäynti on usein epäkäytännöllistä. Satunnaishaku ratkaisee tämän ongelman arpomalla ennalta määritellyn määrän hyperparametrisettejä, tasapainottaen tutkimisen ja tehokkuuden.

RandomizedSearchCV(
    estimator=model, 
    param_distributions=randomized_parameters, 
    n_iter=number_of_models_to_test,  # Number of random combinations to evaluate
    scoring='accuracy',  # Evaluation metric
    random_state=42,  # Ensures reproducibility
)
  • estimator: optimoitava malli (esim. MLPClassifier);
  • param_distributions: sanakirja, jossa avaimina ovat hyperparametrien nimet ja arvoina listat, joista arvot arvotaan;
  • n_iter: määrittää, kuinka monta satunnaista yhdistelmää testataan. Suurempi arvo lisää optimaalisen yhdistelmän löytymisen todennäköisyyttä, mutta vaatii enemmän laskentaa;
  • scoring: määrittää arviointimetriikan (esim. 'accuracy' luokittelussa).
Tehtävä

Swipe to start coding

  1. param_distributions-sanakirjassa luo arvot kahdelle piilotetulle kerrokselle, joissa kummassakin kerroksessa on sama määrä neuroneita, välillä 2030 (mukaan lukien), askelin 2.
  2. param_distributions-sanakirjassa aseta oppimisnopeuden arvot: 0.02, 0.01 ja 0.005.
  3. param_distributions-sanakirjassa luo satunnaisia arvoja opetusepookkien määrälle välillä 1050 (poissulkeva), yhteensä 10 arvoa.
  4. Käytä satunnaistettua hakua 4 iteraatiolla (arvioitavien hyperparametriyhdistelmien määrä) ja käytä tarkkuutta arviointimetriikkana.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 3
single

single

some-alt