Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Monimuuttujaisen Lineaarisen Regressiomallin Rakentaminen | Osio
Ohjatun Oppimisen Perusteet

bookMonimuuttujaisen Lineaarisen Regressiomallin Rakentaminen

LinearRegression-luokka mahdollistaa monimuuttujaisen lineaarisen regressiomallin rakentamisen samalla tavalla kuin yksinkertaisen lineaarisen regressiomallin. Se käsittelee automaattisesti useita piirteitä (sarakkeita) syötematriisissa.

Datan valmistelu

Käytössämme on sama aineisto kuin yksinkertaisen lineaarisen regression esimerkissä, mutta nyt mukana on äidin pituus toisena piirteenä. Ladataan aineisto ja tarkastellaan sen X-muuttujaa:

12345678
import pandas as pd file_link='https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/heights_two_feature.csv' df = pd.read_csv(file_link) # Open the file # Assign the variables X = df[['Father', 'Mother']] y = df['Height'] print(X.head())
copy

Oletuksena parametri fit_intercept=True on asetettu, joten malli laskee vakiotermin () automaattisesti! Voimme syöttää X DataFrame:n (joka on jo 2-ulotteinen) suoraan mallille.

Parametrien etsiminen

Erinomaista! Nyt voimme rakentaa mallin, etsiä parametrit ja tehdä ennusteita.

12345678910111213141516171819202122
from sklearn.linear_model import LinearRegression import numpy as np # Initialize the model model = LinearRegression() # Train the model (No need to add constant!) model.fit(X, y) # Get the parameters beta_0 = model.intercept_ beta_1 = model.coef_[0] # Coefficient for 'Father' beta_2 = model.coef_[1] # Coefficient for 'Mother' print('beta_0 is: ', beta_0) print('beta_1 is: ', beta_1) print('beta_2 is: ', beta_2) # Predict new values # Feature values of new instances: [[Father, Mother], [Father, Mother], ...] X_new = np.array([[65, 62], [70, 65], [75, 70]]) y_pred = model.predict(X_new) # Predict the target print('Predictions:', y_pred)
copy
Note
Huomio

Nyt kun harjoitusaineistossamme on 2 ominaisuutta, meidän täytyy antaa 2 ominaisuutta jokaiselle uudelle havainnolle, jolle haluamme tehdä ennusteen. Siksi käytettiin np.array([[65, 62],[70, 65],[75, 70]]). Huomaa myös, että model.coef_ palauttaa taulukon kertoimia samassa järjestyksessä kuin sarakkeet X:ssä. Koska X oli ['Father', 'Mother'], coef_[0] on isän kerroin ja coef_[1] on äidin kerroin.

question mark

Täytyykö LinearRegression-luokkaan lisätä vakio-sarake manuaalisesti?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 7

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

bookMonimuuttujaisen Lineaarisen Regressiomallin Rakentaminen

Pyyhkäise näyttääksesi valikon

LinearRegression-luokka mahdollistaa monimuuttujaisen lineaarisen regressiomallin rakentamisen samalla tavalla kuin yksinkertaisen lineaarisen regressiomallin. Se käsittelee automaattisesti useita piirteitä (sarakkeita) syötematriisissa.

Datan valmistelu

Käytössämme on sama aineisto kuin yksinkertaisen lineaarisen regression esimerkissä, mutta nyt mukana on äidin pituus toisena piirteenä. Ladataan aineisto ja tarkastellaan sen X-muuttujaa:

12345678
import pandas as pd file_link='https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/heights_two_feature.csv' df = pd.read_csv(file_link) # Open the file # Assign the variables X = df[['Father', 'Mother']] y = df['Height'] print(X.head())
copy

Oletuksena parametri fit_intercept=True on asetettu, joten malli laskee vakiotermin () automaattisesti! Voimme syöttää X DataFrame:n (joka on jo 2-ulotteinen) suoraan mallille.

Parametrien etsiminen

Erinomaista! Nyt voimme rakentaa mallin, etsiä parametrit ja tehdä ennusteita.

12345678910111213141516171819202122
from sklearn.linear_model import LinearRegression import numpy as np # Initialize the model model = LinearRegression() # Train the model (No need to add constant!) model.fit(X, y) # Get the parameters beta_0 = model.intercept_ beta_1 = model.coef_[0] # Coefficient for 'Father' beta_2 = model.coef_[1] # Coefficient for 'Mother' print('beta_0 is: ', beta_0) print('beta_1 is: ', beta_1) print('beta_2 is: ', beta_2) # Predict new values # Feature values of new instances: [[Father, Mother], [Father, Mother], ...] X_new = np.array([[65, 62], [70, 65], [75, 70]]) y_pred = model.predict(X_new) # Predict the target print('Predictions:', y_pred)
copy
Note
Huomio

Nyt kun harjoitusaineistossamme on 2 ominaisuutta, meidän täytyy antaa 2 ominaisuutta jokaiselle uudelle havainnolle, jolle haluamme tehdä ennusteen. Siksi käytettiin np.array([[65, 62],[70, 65],[75, 70]]). Huomaa myös, että model.coef_ palauttaa taulukon kertoimia samassa järjestyksessä kuin sarakkeet X:ssä. Koska X oli ['Father', 'Mother'], coef_[0] on isän kerroin ja coef_[1] on äidin kerroin.

question mark

Täytyykö LinearRegression-luokkaan lisätä vakio-sarake manuaalisesti?

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 7
some-alt