Kursinnhold
Introduksjon til Chat GPT
Introduksjon til Chat GPT
Arbeidsprinsipper for ChatGPT
ChatGPT, som andre modeller i GPT-familien, opererer i en serie av trinn for å generere tekstbaserte svar. Her er en forenklet oversikt over hvordan ChatGPT fungerer:
Merk
I konteksten av ChatGPT refererer en utgangstoken til en enhet av tekst som modellen genererer som en del av sitt svar.
Hvordan bestemmer ChatGPT sannsynlighetsfordelingen for å generere neste utgangstoken?
ChatGPT bestemmer sannsynlighetsfordelingen for å generere neste utgangstoken ved å bruke sin nevrale nettverksarkitektur og forhåndstrente parametere.
Akkurat som hvert nevrale nettverk, er det trent på noen treningsdata for å gi meningsfulle svar. Prosessen med å trene ChatGPT besto av to hovedtrinn:
For det første gjennomgikk det en forhåndstreningsfase hvor det ble eksponert for et enormt korpus av tekst fra internett. Modellen lærte språkstrukturer, grammatikk og generell kunnskap i løpet av denne fasen. Denne forhåndstreningsprosessen utstyrte ChatGPT med en bred forståelse av språk;
For det andre var det en finjusteringsfase. I denne fasen ble modellen raffinert på spesifikke datasett opprettet av OpenAI. Disse datasettene inkluderte demonstrasjoner av korrekt oppførsel og sammenligninger for å rangere forskjellige svar. Finjustering hjalp til med å tilpasse modellens oppførsel, noe som gjorde den mer egnet for å generere trygge og sammenhengende svar i en samtalekontekst. Kombinasjonen av forhåndstrening og finjustering bidro til ChatGPTs evner og oppførsel.
Takk for tilbakemeldingene dine!