Lära Bygga Multipel Linjär Regression | Multipel Linjär Regression

Svep för att visa menyn

OLS-klassen möjliggör att bygga multipel linjär regression på samma sätt som enkel linjär regression. Tyvärr hanterar dock inte funktionen np.polyfit() fallet med flera variabler.

Vi kommer att använda OLS-klassen.

Bygga X̃-matrisen

Vi har samma dataset som i exemplet med enkel linjär regression, men nu har det även moderns längd som den andra variabeln. Vi laddar in det och tittar på dess X-variabel:


              123456789
            
import pandas as pd
import statsmodels.api as sm

file_link='https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/heights_two_feature.csv'
df = pd.read_csv(file_link)	# Open the file
# Assign the variables
X = df[['Father', 'Mother']]
y = df['Height']
print(X.head())

Kom ihåg att vi ska använda OLS(y, X_tilde) för att initiera OLS-objektet. Som du ser innehåller X-variabeln redan två variabler i separata kolumner. För att få X_tilde behöver vi bara lägga till 1:or som första kolumn. Funktionen sm.add_constant(X) gör precis det!


              123
            
# Create X_tilde
X_tilde = sm.add_constant(X)
print(X_tilde.head())

Hitta parametrarna

Utmärkt! Nu kan vi bygga modellen, hitta parametrarna och göra prediktioner på samma sätt som vi gjorde i föregående avsnitt.


              12345678910111213141516
            
import numpy as np

# Initialize an OLS object
regression_model = sm.OLS(y, X_tilde)
# Train the object
regression_model = regression_model.fit()
# Get the paramters
beta_0, beta_1, beta_2 = regression_model.params
print('beta_0 is: ', beta_0)
print('beta_1 is: ', beta_1)
print('beta_2 is: ', beta_2)
# Predict new values
X_new = np.array([[65, 62],[70, 65],[75, 70]])	# Feature values of new instances
X_new_tilde = sm.add_constant(X_new)	# Preprocess X_new
y_pred = regression_model.predict(X_new_tilde)	# Predict the target
print('Predictions:', y_pred)

Notering

Nu när vårt träningsset har 2 funktioner behöver vi ange 2 funktioner för varje ny instans vi vill förutsäga. Det är därför np.array([[65, 62],[70, 65],[75, 70]]) användes i exemplet ovan. Det förutsäger y för 3 nya instanser: [Father:65,Mother:62], [Father:70, Mother:65], [Father:75, Mother:70].

Var allt tydligt?

Tack för dina kommentarer!

Avsnitt 2. Kapitel 3

Fråga AI

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Avsnitt 2. Kapitel 3