Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Parametrien Löytäminen | Osio
Ohjatun Oppimisen Perusteet

bookParametrien Löytäminen

Nyt tiedämme, että lineaarinen regressio on vain viiva, joka parhaiten kuvaa dataa. Mutta miten voit tietää, mikä viiva on oikea?

Voit laskea erotuksen ennustetun arvon ja todellisen tavoitearvon välillä jokaiselle harjoitusaineiston datapisteelle.
Näitä erotuksia kutsutaan residuaaleiksi (tai virheiksi). Tavoitteena on saada residuaalit mahdollisimman pieniksi.

Ordinary Least Squares

Oletusmenetelmä on Ordinary Least Squares (OLS):
Ota jokainen residuaali, korota se toiseen potenssiin (pääasiassa residuaalin etumerkin poistamiseksi) ja summaa kaikki.
Tätä kutsutaan nimellä SSR (Sum of squared residuals). Tehtävänä on löytää parametrit, jotka minimoivat SSR:n.

Normaaliyhtälö

Onneksi meidän ei tarvitse kokeilla kaikkia mahdollisia suoria ja laskea SSR-arvoa niille. SSR:n minimointiin on matemaattinen ratkaisu, joka ei ole kovin laskennallisesti raskas.
Tätä ratkaisua kutsutaan normaaliyhtälöksi.

β=(β0β1βn)=(X~TX~)1X~Tytrue\vec{\beta} = \begin{pmatrix} \beta_0 \\ \beta_1 \\ \dots \\ \beta_n \end{pmatrix} = (\tilde{X}^T \tilde{X})^{-1} \tilde{X}^T y_{\text{true}}

Missä:

  • β0,β1,,βn\beta_0, \beta_1, \dots, \beta_n – ovat mallin parametrit;
X~=(1XX2Xn);\tilde{X} = \begin{pmatrix} | & | & | & \dots & | \\ 1 & X & X^2 & \dots & X^n \\ | & | & | & \dots & | \end{pmatrix};
  • XX – on opetusdatan piirteiden arvojen taulukko;
  • XkX^k – on $X$-taulukon alkioittainen potenssi $k$;
  • ytruey_{\text{true}} – on opetusdatan tavoitearvojen taulukko.

Tämä yhtälö antaa meille suoran parametrit, joilla SSR on pienin.
Etkö ymmärtänyt, miten se toimii? Ei hätää! Kyseessä on melko monimutkainen matematiikka. Sinun ei kuitenkaan tarvitse laskea parametreja itse. Monet kirjastot sisältävät jo toteutuksen lineaariselle regressiolle.

Kysely

1. Tarkastele yllä olevaa kuvaa. Mikä regressiosuora on parempi?

2. y_true - y_predicted kutsutaan

question mark

Tarkastele yllä olevaa kuvaa. Mikä regressiosuora on parempi?

Select the correct answer

question mark

y_true - y_predicted kutsutaan

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 2

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

bookParametrien Löytäminen

Pyyhkäise näyttääksesi valikon

Nyt tiedämme, että lineaarinen regressio on vain viiva, joka parhaiten kuvaa dataa. Mutta miten voit tietää, mikä viiva on oikea?

Voit laskea erotuksen ennustetun arvon ja todellisen tavoitearvon välillä jokaiselle harjoitusaineiston datapisteelle.
Näitä erotuksia kutsutaan residuaaleiksi (tai virheiksi). Tavoitteena on saada residuaalit mahdollisimman pieniksi.

Ordinary Least Squares

Oletusmenetelmä on Ordinary Least Squares (OLS):
Ota jokainen residuaali, korota se toiseen potenssiin (pääasiassa residuaalin etumerkin poistamiseksi) ja summaa kaikki.
Tätä kutsutaan nimellä SSR (Sum of squared residuals). Tehtävänä on löytää parametrit, jotka minimoivat SSR:n.

Normaaliyhtälö

Onneksi meidän ei tarvitse kokeilla kaikkia mahdollisia suoria ja laskea SSR-arvoa niille. SSR:n minimointiin on matemaattinen ratkaisu, joka ei ole kovin laskennallisesti raskas.
Tätä ratkaisua kutsutaan normaaliyhtälöksi.

β=(β0β1βn)=(X~TX~)1X~Tytrue\vec{\beta} = \begin{pmatrix} \beta_0 \\ \beta_1 \\ \dots \\ \beta_n \end{pmatrix} = (\tilde{X}^T \tilde{X})^{-1} \tilde{X}^T y_{\text{true}}

Missä:

  • β0,β1,,βn\beta_0, \beta_1, \dots, \beta_n – ovat mallin parametrit;
X~=(1XX2Xn);\tilde{X} = \begin{pmatrix} | & | & | & \dots & | \\ 1 & X & X^2 & \dots & X^n \\ | & | & | & \dots & | \end{pmatrix};
  • XX – on opetusdatan piirteiden arvojen taulukko;
  • XkX^k – on $X$-taulukon alkioittainen potenssi $k$;
  • ytruey_{\text{true}} – on opetusdatan tavoitearvojen taulukko.

Tämä yhtälö antaa meille suoran parametrit, joilla SSR on pienin.
Etkö ymmärtänyt, miten se toimii? Ei hätää! Kyseessä on melko monimutkainen matematiikka. Sinun ei kuitenkaan tarvitse laskea parametreja itse. Monet kirjastot sisältävät jo toteutuksen lineaariselle regressiolle.

Kysely

1. Tarkastele yllä olevaa kuvaa. Mikä regressiosuora on parempi?

2. y_true - y_predicted kutsutaan

question mark

Tarkastele yllä olevaa kuvaa. Mikä regressiosuora on parempi?

Select the correct answer

question mark

y_true - y_predicted kutsutaan

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 2
some-alt