Kursusindhold
Introduktion til Chat GPT
Introduktion til Chat GPT
ChatGPT Arbejdsprincipper
ChatGPT, ligesom andre modeller i GPT-familien, opererer i en række trin for at generere tekstbaserede svar. Her er en forenklet gennemgang af, hvordan ChatGPT fungerer:
Bemærk
I sammenhæng med ChatGPT refererer en output token til en enhed af tekst, som modellen genererer som en del af sit svar.
Hvordan bestemmer ChatGPT sandsynlighedsfordelingen for at generere den næste output token?
ChatGPT bestemmer sandsynlighedsfordelingen for at generere den næste output token ved hjælp af sin neurale netværksarkitektur og forudtrænede parametre.
Ligesom hvert neuralt netværk er det trænet på nogle træningsdata for at give meningsfulde svar. Processen med at træne ChatGPT bestod af to hovedtrin:
For det første gennemgik det en fortræningsfase, hvor det blev udsat for et enormt korpus af tekst fra internettet. Modellen lærte sprogstrukturer, grammatik og generel viden i denne fase. Denne fortræningsproces udstyrede ChatGPT med en bred forståelse af sprog;
For det andet var der en finjusteringsfase. I denne fase blev modellen forfinet på specifikke datasæt skabt af OpenAI. Disse datasæt inkluderede demonstrationer af korrekt adfærd og sammenligninger for at rangere forskellige svar. Finjustering hjalp med at tilpasse modellens adfærd, hvilket gjorde den mere egnet til at generere sikre og sammenhængende svar i en samtalekontekst. Kombinationen af fortræning og finjustering bidrog til ChatGPT's kapaciteter og adfærd.
Tak for dine kommentarer!