Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Oversikt over kunstige nevrale nettverk | Teoretiske Grunnlag
Dype Generative Modeller med Python

Oversikt over kunstige nevrale nettverk

Sveip for å vise menyen

Kunstige nevrale nettverk (ANNs) er grunnlaget for moderne generativ KI. De er utviklet for å gjenkjenne mønstre, lære representasjoner og generere data som etterligner virkelige fordelinger. En kortfattet og omfattende oversikt over ANNs, med vekt på deres betydning innen generativ KI.

Struktur av nevrale nettverk

Nevroner og lag

nevron

Et nevralt nettverk består av sammenkoblede enheter kalt nevroner, som er organisert i lag:

  • Inndatalag: mottar rådata (f.eks. bilder, tekst, numeriske inndata);
  • Skjulte lag: behandler og transformerer data ved hjelp av vektede forbindelser;
  • Utgangslag: produserer prediksjoner eller klassifiseringer.

Hvert nevron anvender en vektet sum på sine inndata og sender resultatet gjennom en aktiveringsfunksjon:

z=i=1nωixi+bz=\sum^n_{i=1}\omega_ix_i+b

hvor:

  • xix_i er inndataverdi;
  • ωi\omega_i er vekter;
  • bb er bias-termen;
  • zz er den vektede summen som sendes til aktiveringsfunksjonen.

Aktiveringsfunksjoner

Aktiveringsfunksjoner introduserer ikke-linearitet, noe som gjør det mulig for nettverk å lære komplekse mønstre. Vanlige aktiveringsfunksjoner inkluderer:

  • Sigmoid, brukt for sannsynligheter: σ(z)=11+ez\sigma(z)=\dfrac{1}{1+e^{-z}}
relu
  • ReLU (Rectified Linear Unit), ofte brukt i dype nettverk: f(z)=max(0,z)f(z)=\max(0,z)
relu
  • Tanh, nyttig for nullsentrerte utdata: tanh(z)=ezezez+ez\tanh(z)=\dfrac{e^z-e^{-z}}{e^z+e^{-z}}
tanh

Fremover- og bakoverpropagasjon

Fremoverpropagasjon

Fremoverpropagasjon refererer til å sende input gjennom nettverket for å beregne utdata. Hver nevron beregner:

a=f(z)=f(i=1nωixi+b)a=f(z)=f\left( \sum^n_{i=1}\omega_i x_i + b \right)

hvor f(z)f(z) er aktiveringsfunksjonen.

Tilbakepropagering og gradientnedstigning

For å forbedre prediksjoner justerer kunstige nevrale nettverk vektene ved hjelp av tilbakepropagering, som minimerer feil ved bruk av gradientnedstigning. Vektoppdateringsregelen i gradientnedstigning er:

ωi(t+1)=ωi(t)ηLωi\omega^{(t+1)}_i=\omega^{(t)}_i - \eta *\frac{\partial L}{\partial \omega_i}

hvor:

  • η\eta er læringsraten;
  • LL er tapfunksjonen;
  • Lωi\frac{\partial L}{\partial \omega_i} er gradienten til tapet med hensyn til ωi\omega_i.

Tapfunksjoner og treningsprosess

Tapfunksjoner

Tapfunksjoner måler forskjellen mellom predikerte og faktiske verdier. Vanlige tapfunksjoner inkluderer:

  • Mean Squared Error (MSE) (for regresjon):
MSE=1ni=1n(yiy^i2)\text{MSE}=\frac{1}{n}\sum^n_{i=1}(y_i-\hat{y}_i^2)
  • Kryssentropi-tap (for klassifisering):
L=i=1nyilog(y^i)\text{L}=-\sum^n_{i=1}y_i\log(\hat{y}_i)

hvor:

  • yiy_i er den sanne etiketten;
  • y^i\hat{y}_i er den predikerte sannsynligheten.

Treningsprosess

  1. Initialisere vekter tilfeldig;
  2. Utføre fremoverpropagering for å beregne prediksjoner;
  3. Beregne tap ved hjelp av valgt tapsfunksjon;
  4. Bruke bakoverpropagering for å beregne vektoppdateringer;
  5. Oppdatere vekter med gradient descent;
  6. Gjenta i flere epoker til nettverket konvergerer.

Teoremet om universell approksimasjon og dyp læring

Teoremet om universell approksimasjon

Teoremet om universell approksimasjon sier at et nevralt nettverk med minst ett skjult lag kan tilnærme enhver kontinuerlig funksjon, gitt tilstrekkelig antall nevroner og riktige vekter. Dette forklarer hvorfor kunstige nevrale nettverk kan modellere svært komplekse sammenhenger.

Dyp læring og dens betydning

Dyp læring utvider kunstige nevrale nettverk ved å legge til mange skjulte lag, noe som gjør det mulig å:

  • Ekstrahere hierarkiske trekk (nyttig i bildebehandling og NLP);
  • Modellere komplekse sannsynlighetsfordelinger (kritisk for generativ KI);
  • Lære uten manuell trekkonstruksjon (som sett i selv-supervisert læring).

Konklusjon

Dette kapittelet introduserte kjerneprinsippene for kunstige nevrale nettverk (ANN), med vekt på deres struktur, læringsprosess og betydning innen dyp læring. Disse konseptene danner grunnlaget for avanserte generative AI-teknikker som GANs og VAEs, som benytter nevrale nettverk for å generere realistiske data.

1. Hvilket av følgende er IKKE en komponent i et kunstig nevralt nettverk?

2. Hva er hovedformålet med backpropagation i nevrale nettverk?

3. Den universelle approksimasjonsteoremet sier at et tilstrekkelig stort nevralt nettverk kan tilnærme hvilken av følgende?

question mark

Hvilket av følgende er IKKE en komponent i et kunstig nevralt nettverk?

Velg det helt riktige svaret

question mark

Hva er hovedformålet med backpropagation i nevrale nettverk?

Velg det helt riktige svaret

question mark

Den universelle approksimasjonsteoremet sier at et tilstrekkelig stort nevralt nettverk kan tilnærme hvilken av følgende?

Velg det helt riktige svaret

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 4

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Seksjon 2. Kapittel 4
some-alt