Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Opetusjoukko | Osio
Koneoppimisen Perusteet

bookOpetusjoukko

Ohjatun tai ohjaamattoman oppimisen yhteydessä opetusjoukko esitetään yleensä taulukkomuodossa.

Esimerkkinä on diabetes-aineisto, jota käytetään ennustamaan, onko henkilöllä diabetes. Se sisältää 768 naisen tietueet, joissa on parametreina esimerkiksi ikä, painoindeksi ja verenpaine. Näitä parametreja kutsutaan piirteiksi.

Aineistossa on myös 'Outcome'-sarake, joka ilmaisee, onko henkilöllä diabetes. Tämä on kohdemuuttuja.

Jokainen taulukon rivi on instanssi (myös datapiste tai näyte), joka edustaa yhden henkilön tietoja.

Taulukossa (opetusjoukossa) on kohdesarake, mikä tarkoittaa, että se on merkitty.

Tehtävänä on kouluttaa ML-malli tällä opetusjoukolla, ja kun se on koulutettu, se voi ennustaa muille henkilöille (uusille instansseille) diabeteksen esiintymistä pelkkien piirteiden perusteella.

Note
Huomio

Tämä opetusjoukko on esimerkki vinoutuneesta aineistosta, koska se sisältää ainoastaan tietoja vähintään 21-vuotiaista naisista. Tämän vuoksi malli voi antaa epätarkempia ennusteita miehille tai alle 21-vuotiaille naisille, koska sitä ei ole koulutettu näillä ryhmillä.

Koodauksessa ominaisuussarakkeet määritellään yleensä X:ksi ja kohdesarakkeet määritellään y:ksi.

Uusien havaintojen ominaisuudet määritellään X_new:ksi.

question-icon

Yhdistä muuttujien nimet niihin tietoihin, joita ne yleensä sisältävät.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 3

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

bookOpetusjoukko

Pyyhkäise näyttääksesi valikon

Ohjatun tai ohjaamattoman oppimisen yhteydessä opetusjoukko esitetään yleensä taulukkomuodossa.

Esimerkkinä on diabetes-aineisto, jota käytetään ennustamaan, onko henkilöllä diabetes. Se sisältää 768 naisen tietueet, joissa on parametreina esimerkiksi ikä, painoindeksi ja verenpaine. Näitä parametreja kutsutaan piirteiksi.

Aineistossa on myös 'Outcome'-sarake, joka ilmaisee, onko henkilöllä diabetes. Tämä on kohdemuuttuja.

Jokainen taulukon rivi on instanssi (myös datapiste tai näyte), joka edustaa yhden henkilön tietoja.

Taulukossa (opetusjoukossa) on kohdesarake, mikä tarkoittaa, että se on merkitty.

Tehtävänä on kouluttaa ML-malli tällä opetusjoukolla, ja kun se on koulutettu, se voi ennustaa muille henkilöille (uusille instansseille) diabeteksen esiintymistä pelkkien piirteiden perusteella.

Note
Huomio

Tämä opetusjoukko on esimerkki vinoutuneesta aineistosta, koska se sisältää ainoastaan tietoja vähintään 21-vuotiaista naisista. Tämän vuoksi malli voi antaa epätarkempia ennusteita miehille tai alle 21-vuotiaille naisille, koska sitä ei ole koulutettu näillä ryhmillä.

Koodauksessa ominaisuussarakkeet määritellään yleensä X:ksi ja kohdesarakkeet määritellään y:ksi.

Uusien havaintojen ominaisuudet määritellään X_new:ksi.

question-icon

Yhdistä muuttujien nimet niihin tietoihin, joita ne yleensä sisältävät.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 3
some-alt