Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Kuinka Kielimallit "Ajattelevat" | Kuinka nykyaikainen tekoäly toimii
Tekoälyn ymmärtäminen työelämässä

bookKuinka Kielimallit "Ajattelevat"

Pyyhkäise näyttääksesi valikon

Auton moottorin toimintaa ei tarvitse ymmärtää ajaakseen — mutta tieto siitä, että se toimii polttoaineella, auttaa välttämään bensan loppumisen. Sama logiikka pätee tekoälyyn. Et tarvitse tietojenkäsittelytieteen tutkintoa, mutta yhden keskeisen ajatuksen ymmärtäminen auttaa hahmottamaan kaiken muun tässä kurssissa.

Ennustaminen, ydinkonsepti

Suuret kielimallit (LLM:t) — teknologia ChatGPT:n, Clauden, Geminin ja muiden taustalla — toimivat ennustamalla, mikä tulee seuraavaksi.

Saatuaan sanajonon malli laskee, mikä sana (tai lause) todennäköisimmin seuraa, perustuen valtavista tekstimääristä oppimiinsa kaavoihin: kirjoista, artikkeleista, verkkosivuista, koodista ja muusta.

Tämä muistuttaa puhelimen automaattista täydennystä — mutta koulutettuna käytännössä koko internetin aineistolla ja huomattavasti kehittyneempänä.

Kuvakaappauksen kuvaus: Selkeä, vaakasuuntainen kaavio, jossa kolme vaihetta yhdistettyinä nuolilla. Vaihe 1 — tekstikenttä, jonka otsikkona "Syötteesi" ja sisältönä: "The weather today is…". Vaihe 2 — laatikko, jonka otsikkona "Malli ennustaa todennäköisimmän seuraavan sanan" ja jossa kolme vaihtoehtoa todennäköisyyksineen: "sunny" 42 %, "cold" 31 %, "unpredictable" 27 %. Vaihe 3 — laatikko, jonka otsikkona "Tuloste rakentuu sana kerrallaan". Yksinkertainen, selkeä ulkoasu, ei teknistä jargonia kaaviossa.

Mitä ovat tokenit?

Tekoäly ei lue sanoja samalla tavalla kuin ihminen. Se pilkkoo tekstin pieniin osiin, joita kutsutaan tokeneiksi — nämä vastaavat suunnilleen sanoja tai sanan osia.

Esimerkiksi:

  • "running" voi olla yksi token;
  • "unbelievable" voidaan jakaa osiin "un" + "believ" + "able";
  • Myös välilyönnit ja välimerkit ovat tokeneita.

Tämän vuoksi tekoäly joskus käsittelee epätavallisia sanoja kömpelösti tai pitkät syötteet hidastavat toimintaa — jokainen token vaatii laskentatehoa.

Käytännössä tärkeintä on tietää tämä: mitä enemmän tokeneita keskustelussa on, sitä enemmän kontekstia mallilla on — ja sitä enemmän käyttö maksaa (siksi ilmaisversioissa on rajoituksia).

Miksi tekoäly joskus keksii asioita

Malli ennustaa, mikä kuulostaa oikealta, eikä aina tuota sitä, mikä on tosiasiallisesti oikein. Kun se kohtaa aiheen, jota ei ole koulutettu käsittelemään, tai kysymyksen, johon se ei osaa vastata varmasti, se ei sano "en tiedä" — vaan tuottaa silti uskottavalta kuulostavan vastauksen.

Tätä kutsutaan hallusinaatioksi.

Se ei ole virhe, eikä tekoäly valehtele. Se on ennustamisen perusominaisuus. Tämän ymmärtäminen on ensimmäinen askel tekoälyn turvalliseen käyttöön. Käsittelemme aihetta tarkemmin osiossa 3.

Tekoäly ennustaa — se ei oikeasti tiedä. Tämä yksi oivallus selittää, miksi hyvät kehotteet ovat tärkeitä, miksi tärkeät faktat pitää tarkistaa ja miksi ihmisen arviointi on aina välttämätöntä tekoälyn kanssa työskennellessä.

1. Mikä on suurten kielimallien, kuten ChatGPT:n, toiminnan ydinajatus?

2. Miksi tekoäly tuottaa joskus vastauksia, jotka eivät ole tosiasiallisesti oikeita?

question mark

Mikä on suurten kielimallien, kuten ChatGPT:n, toiminnan ydinajatus?

Valitse oikea vastaus

question mark

Miksi tekoäly tuottaa joskus vastauksia, jotka eivät ole tosiasiallisesti oikeita?

Valitse oikea vastaus

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 2

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 1. Luku 2
some-alt