Leer Hyperparameterafstemming

Hyperparameters in neurale netwerken

Neurale netwerken, waaronder perceptrons, hebben verschillende hyperparameters die hun prestaties beïnvloeden. In tegenstelling tot modelparameters (zoals gewichten en biases) worden hyperparameters voorafgaand aan de training ingesteld. Enkele belangrijke hyperparameters in perceptrons zijn:

Aantal verborgen lagen en neuronen per laag: bepaalt het vermogen van het model om complexe patronen te leren. Te weinig neuronen leidt tot underfitting, terwijl te veel neuronen overfitting kan veroorzaken;
Leerpercentage: bepaalt in welke mate het model de gewichten aanpast tijdens de training. Een hoog leerpercentage kan de training instabiel maken, terwijl een laag leerpercentage tot langzame convergentie kan leiden:

Aantal trainingsepochs: bepaalt hoe vaak het model de trainingsdata doorloopt. Meer epochs zorgen voor beter leren, maar kunnen bij overmatig gebruik tot overfitting leiden.

Opmerking

Samenvattend: overfitting treedt op wanneer een model de trainingsdata te goed leert en ruis in plaats van algemene patronen oppikt. Dit resulteert in hoge nauwkeurigheid op de trainingsset, maar slechte generalisatie naar onbekende data.

Underfitting daarentegen ontstaat wanneer een model te eenvoudig is om de onderliggende patronen in de data te herkennen. Dit leidt tot zowel slechte prestaties op de training als op de testset, wat aangeeft dat het model onvoldoende capaciteit heeft om effectief te leren.

Afstemming van hyperparameters

Afstemming van hyperparameters is essentieel voor het optimaliseren van neurale netwerken. Een slecht afgestemd model kan leiden tot onder- of overfitting.

Het is mogelijk om het aantal epochs, het aantal verborgen lagen, hun grootte en het leerpercentage aan te passen om te observeren hoe de nauwkeurigheid op de trainings- en testsets verandert:


              1234567891011121314151617181920212223
            
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score
import numpy as np
import warnings
# Ignore warnings
warnings.filterwarnings("ignore")
import os
os.system('wget https://codefinity-content-media.s3.eu-west-1.amazonaws.com/f9fc718f-c98b-470d-ba78-d84ef16ba45f/section_2/data.py 2>/dev/null')
from data import X_train, y_train, X_test, y_test

np.random.seed(10)
# Tweak hyperparameters here
model = MLPClassifier(max_iter=100, hidden_layer_sizes=(6, 6), learning_rate_init=0.01, random_state=10)

model.fit(X_train, y_train)

y_pred_train = model.predict(X_train)
y_pred_test = model.predict(X_test)
# Comparing train set accuracy and test set accuracy
train_accuracy = accuracy_score(y_train, y_pred_train)
test_accuracy = accuracy_score(y_test, y_pred_test)
print(f'Train accuracy: {train_accuracy:.3f}')
print(f'Test accuracy: {test_accuracy:.3f}')

Het vinden van de juiste combinatie van hyperparameters vereist systematische experimentatie en aanpassingen. Dit gebeurt vaak met technieken zoals grid search (het proberen van alle mogelijke combinaties van hyperparameters) en random search (het testen van een willekeurige subset van hyperparametergwaarden).

Het trainen van een neuraal netwerk volgt in wezen een iteratief proces:

Definieer het model met initiële hyperparameters;
Train het model met behulp van de trainingsdataset;
Evalueer de prestaties op een testset;
Pas hyperparameters aan (bijvoorbeeld aantal lagen, leerpercentage);
Herhaal het proces tot de gewenste prestaties zijn bereikt.

Deze iteratieve verfijning zorgt ervoor dat het model goed generaliseert naar onbekende data.

1. Welke van de volgende is een hyperparameter in plaats van een modelparameter?

2. Een te hoge leerrate zal hoogstwaarschijnlijk veroorzaken:

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 3. Hoofdstuk 2

Vraag AI

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Awesome!

Completion rate improved to 4

Veeg om het menu te tonen