Kurssisisältö
Lineaarinen Regressio Pythonilla
Lineaarinen Regressio Pythonilla
Mikä on lineaarinen regressio
Peruskäsitteet
Regressio on valvottu oppimistehtävä, jossa ennustetaan numeerista arvoa (esim. talon hinta), jota kutsutaan kohteeksi, perustuen joukkoon syötemuuttujia (esim. koko, ikä, sijainti jne.), joita kutsutaan piirteiksi.
Mallin kouluttamiseksi on annettava useita esimerkkejä tällaisista taloista, sekä piirteet että kohde. Esimerkkijoukkoa, jolla mallia koulutetaan, kutsutaan opetusjoukoksi.
Yksinkertaisin malli, joka pystyy suorittamaan regressiotehtäviä, on lineaarinen regressio. Tarkastellaan tätä hajontakuviota, joka esittää henkilön pituutta ja hänen isänsä pituutta.
Miten se toimii
Yksinkertainen lineaarinen regressio sovittaa suoran viivan aineistoon siten, että viiva on mahdollisimman lähellä havaintopisteitä.
Ennusteiden tekeminen
Nyt voimme käyttää tätä viivaa ennustamaan kohdearvon uudelle pisteelle.
Esimerkiksi, jos haluat ennustaa henkilön pituuden, kun hänen isänsä pituus on 63.5 tuumaa. Valitse viivalta kohta, joka vastaa X=63.5, ja sen y-arvo on ennusteemme, yksinkertaista.
Malli ennustaa henkilön pituudeksi 64.3 tuumaa.
Yksinkertaisen lineaarisen regressioyhtälön kaava
Kuten saatat muistaa koulusta, suoran yhtälö on y=b+ax, joten koulutuksen aikana yksinkertainen lineaarinen regressio oppii vain, mitkä arvot a ja b:n tulisi olla halutun suoran muodostamiseksi. Mallin oppimia arvoja kutsutaan parametreiksi, ja myöhemmin kurssilla merkitsemme parametreja 𝛽:llä a:n ja b:n sijaan. Näin ollen yksinkertaisen lineaarisen regressiomme yhtälö on:
1. Regressiossa arvoa, jota haluamme ennustaa, kutsutaan:
2. Täydennä puuttuvat kohdat
Kiitos palautteestasi!