Opetusjoukko
Ohjatun tai ohjaamattoman oppimisen yhteydessä opetusjoukko esitetään yleensä taulukkomuodossa.
Esimerkkinä on diabetes-aineisto, jota käytetään ennustamaan, onko henkilöllä diabetes. Se sisältää 768 naisen tietueet, joissa on parametreina esimerkiksi ikä, painoindeksi ja verenpaine. Näitä parametreja kutsutaan piirteiksi.
Aineistossa on myös 'Outcome'
-sarake, joka ilmaisee, onko henkilöllä diabetes. Tämä on kohdemuuttuja.
Jokainen rivin taulukossa on instanssi (tunnetaan myös nimillä datapiste tai otos), joka edustaa yhden henkilön tietoja.
Taulukossa (opetusjoukossa) on kohdesarake, mikä tarkoittaa, että se on merkitty.
Tehtävänä on kouluttaa ML-malli tällä opetusjoukolla, ja kun se on koulutettu, se voi ennustaa muille henkilöille (uusille instansseille) diabeteksen esiintymistä pelkkien piirteiden perusteella.
Tämä opetusjoukko on esimerkki vinoutuneesta aineistosta, sillä se sisältää ainoastaan tietoa vähintään 21-vuotiaista naisista. Tämän vuoksi malli voi antaa epätarkempia ennusteita miehille tai alle 21-vuotiaille naisille, koska sitä ei ole koulutettu näillä ryhmillä.
Koodattaessa ominaisuussarakkeet määritellään yleensä muuttujaan X
ja kohdesarakkeet muuttujaan y
.
Uusien havaintojen ominaisuudet määritellään muuttujaan X_new
.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 3.13
Opetusjoukko
Pyyhkäise näyttääksesi valikon
Ohjatun tai ohjaamattoman oppimisen yhteydessä opetusjoukko esitetään yleensä taulukkomuodossa.
Esimerkkinä on diabetes-aineisto, jota käytetään ennustamaan, onko henkilöllä diabetes. Se sisältää 768 naisen tietueet, joissa on parametreina esimerkiksi ikä, painoindeksi ja verenpaine. Näitä parametreja kutsutaan piirteiksi.
Aineistossa on myös 'Outcome'
-sarake, joka ilmaisee, onko henkilöllä diabetes. Tämä on kohdemuuttuja.
Jokainen rivin taulukossa on instanssi (tunnetaan myös nimillä datapiste tai otos), joka edustaa yhden henkilön tietoja.
Taulukossa (opetusjoukossa) on kohdesarake, mikä tarkoittaa, että se on merkitty.
Tehtävänä on kouluttaa ML-malli tällä opetusjoukolla, ja kun se on koulutettu, se voi ennustaa muille henkilöille (uusille instansseille) diabeteksen esiintymistä pelkkien piirteiden perusteella.
Tämä opetusjoukko on esimerkki vinoutuneesta aineistosta, sillä se sisältää ainoastaan tietoa vähintään 21-vuotiaista naisista. Tämän vuoksi malli voi antaa epätarkempia ennusteita miehille tai alle 21-vuotiaille naisille, koska sitä ei ole koulutettu näillä ryhmillä.
Koodattaessa ominaisuussarakkeet määritellään yleensä muuttujaan X
ja kohdesarakkeet muuttujaan y
.
Uusien havaintojen ominaisuudet määritellään muuttujaan X_new
.
Kiitos palautteestasi!