Parametrien Löytäminen
Nyt tiedämme, että lineaarinen regressio on vain viiva, joka parhaiten kuvaa dataa. Mutta miten voit tietää, mikä viiva on oikea?
Voit laskea erotuksen ennustetun arvon ja todellisen tavoitearvon välillä jokaiselle harjoitusaineiston datapisteelle.
Näitä erotuksia kutsutaan residuaaleiksi (tai virheiksi). Tavoitteena on saada residuaalit mahdollisimman pieniksi.
Ordinary Least Squares
Oletusmenetelmä on Ordinary Least Squares (OLS):
Ota jokainen residuaali, korota se toiseen potenssiin (pääasiassa residuaalin etumerkin poistamiseksi) ja summaa kaikki.
Tätä kutsutaan nimellä SSR (Sum of squared residuals). Tehtävänä on löytää parametrit, jotka minimoivat SSR:n.
Normaaliyhtälö
Onneksi meidän ei tarvitse kokeilla kaikkia mahdollisia suoria ja laskea SSR-arvoa niille. SSR:n minimointiin on matemaattinen ratkaisu, joka ei ole kovin laskennallisesti raskas.
Tätä ratkaisua kutsutaan normaaliyhtälöksi.
Missä:
- β0,β1,…,βn – ovat mallin parametrit;
- X – on opetusdatan piirteiden arvojen taulukko;
- Xk – on $X$-taulukon alkioittainen potenssi $k$;
- ytrue – on opetusdatan tavoitearvojen taulukko.
Tämä yhtälö antaa meille suoran parametrit, joilla SSR on pienin.
Etkö ymmärtänyt, miten se toimii? Ei hätää! Kyseessä on melko monimutkainen matematiikka. Sinun ei kuitenkaan tarvitse laskea parametreja itse. Monet kirjastot sisältävät jo toteutuksen lineaariselle regressiolle.
Kysely
1. Tarkastele yllä olevaa kuvaa. Mikä regressiosuora on parempi?
2. y_true - y_predicted kutsutaan
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 3.33
Parametrien Löytäminen
Pyyhkäise näyttääksesi valikon
Nyt tiedämme, että lineaarinen regressio on vain viiva, joka parhaiten kuvaa dataa. Mutta miten voit tietää, mikä viiva on oikea?
Voit laskea erotuksen ennustetun arvon ja todellisen tavoitearvon välillä jokaiselle harjoitusaineiston datapisteelle.
Näitä erotuksia kutsutaan residuaaleiksi (tai virheiksi). Tavoitteena on saada residuaalit mahdollisimman pieniksi.
Ordinary Least Squares
Oletusmenetelmä on Ordinary Least Squares (OLS):
Ota jokainen residuaali, korota se toiseen potenssiin (pääasiassa residuaalin etumerkin poistamiseksi) ja summaa kaikki.
Tätä kutsutaan nimellä SSR (Sum of squared residuals). Tehtävänä on löytää parametrit, jotka minimoivat SSR:n.
Normaaliyhtälö
Onneksi meidän ei tarvitse kokeilla kaikkia mahdollisia suoria ja laskea SSR-arvoa niille. SSR:n minimointiin on matemaattinen ratkaisu, joka ei ole kovin laskennallisesti raskas.
Tätä ratkaisua kutsutaan normaaliyhtälöksi.
Missä:
- β0,β1,…,βn – ovat mallin parametrit;
- X – on opetusdatan piirteiden arvojen taulukko;
- Xk – on $X$-taulukon alkioittainen potenssi $k$;
- ytrue – on opetusdatan tavoitearvojen taulukko.
Tämä yhtälö antaa meille suoran parametrit, joilla SSR on pienin.
Etkö ymmärtänyt, miten se toimii? Ei hätää! Kyseessä on melko monimutkainen matematiikka. Sinun ei kuitenkaan tarvitse laskea parametreja itse. Monet kirjastot sisältävät jo toteutuksen lineaariselle regressiolle.
Kysely
1. Tarkastele yllä olevaa kuvaa. Mikä regressiosuora on parempi?
2. y_true - y_predicted kutsutaan
Kiitos palautteestasi!