Opetusjoukko
Ohjatun tai ohjaamattoman oppimisen yhteydessä harjoitusaineisto esitetään yleensä taulukkomuodossa.
Esimerkkinä on diabetes-aineisto, jota käytetään ennustamaan, onko henkilöllä diabetes. Se sisältää 768 naisen tietueet, joissa on parametreina esimerkiksi ikä, painoindeksi ja verenpaine. Näitä parametreja kutsutaan piirteiksi.
Aineistossa on myös 'Outcome'-sarake, joka ilmaisee, onko henkilöllä diabetes. Tämä on kohdemuuttuja.
Jokainen taulun rivi on instanssi (myös datapiste tai otos), joka edustaa yksittäisen henkilön tietoja.
Taulukossa (harjoitusaineistossa) on mukana kohdesarake, mikä tarkoittaa, että se on merkitty.
Tavoitteena on kouluttaa ML-malli tällä harjoitusaineistolla, ja kun malli on koulutettu, se voi ennustaa muille henkilöille (uusille instansseille) diabeteksen esiintymistä pelkkien piirteiden perusteella.
Tämä harjoitusaineisto on esimerkki vinoutuneesta aineistosta, sillä se sisältää ainoastaan tietoja vähintään 21-vuotiaista naisista. Tämän vuoksi malli voi antaa vähemmän tarkkoja ennusteita miehille tai alle 21-vuotiaille naisille, koska sitä ei ole koulutettu näillä ryhmillä.
Koodattaessa ominaisuussarakkeet määritetään yleensä X:ksi ja kohdesarakkeet määritetään y:ksi.
Uusien havaintojen ominaisuudet määritetään nimellä X_new.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
What is the difference between features and the target variable?
Can you explain what X, y, and X_new represent in machine learning?
How does the model use X_new to make predictions?
Awesome!
Completion rate improved to 3.13
Opetusjoukko
Pyyhkäise näyttääksesi valikon
Ohjatun tai ohjaamattoman oppimisen yhteydessä harjoitusaineisto esitetään yleensä taulukkomuodossa.
Esimerkkinä on diabetes-aineisto, jota käytetään ennustamaan, onko henkilöllä diabetes. Se sisältää 768 naisen tietueet, joissa on parametreina esimerkiksi ikä, painoindeksi ja verenpaine. Näitä parametreja kutsutaan piirteiksi.
Aineistossa on myös 'Outcome'-sarake, joka ilmaisee, onko henkilöllä diabetes. Tämä on kohdemuuttuja.
Jokainen taulun rivi on instanssi (myös datapiste tai otos), joka edustaa yksittäisen henkilön tietoja.
Taulukossa (harjoitusaineistossa) on mukana kohdesarake, mikä tarkoittaa, että se on merkitty.
Tavoitteena on kouluttaa ML-malli tällä harjoitusaineistolla, ja kun malli on koulutettu, se voi ennustaa muille henkilöille (uusille instansseille) diabeteksen esiintymistä pelkkien piirteiden perusteella.
Tämä harjoitusaineisto on esimerkki vinoutuneesta aineistosta, sillä se sisältää ainoastaan tietoja vähintään 21-vuotiaista naisista. Tämän vuoksi malli voi antaa vähemmän tarkkoja ennusteita miehille tai alle 21-vuotiaille naisille, koska sitä ei ole koulutettu näillä ryhmillä.
Koodattaessa ominaisuussarakkeet määritetään yleensä X:ksi ja kohdesarakkeet määritetään y:ksi.
Uusien havaintojen ominaisuudet määritetään nimellä X_new.
Kiitos palautteestasi!