Stryg for at vise menuen

Opbygning af en lineær regressionsmodel

I statsmodels kan OLS-klassen bruges til at oprette en lineær regressionsmodel.

Først skal der initialiseres et OLS-klasseobjekt ved hjælp af sm.OLS(y, X_tilde). Derefter trænes modellen med metoden fit().

model = sm.OLS(y, X_tilde)
model = model.fit()

Dette svarer til:

model = sm.OLS(y, X_tilde).fit()

Bemærk

Konstruktøren for OLS-klassen forventer et specifikt array X_tilde som input, hvilket vi så i den normale ligning. Derfor skal du konvertere dit X-array til X_tilde. Dette kan opnås ved at bruge funktionen sm.add_constant().

Finde parametre

Når modellen er trænet, kan du nemt tilgå parametrene ved hjælp af attributten params.


              123456789
            
import statsmodels.api as sm
import pandas as pd

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv')
X, y = df['Father'], df['Height']
X_tilde = sm.add_constant(X)
model = sm.OLS(y, X_tilde).fit()
beta_0, beta_1 = model.params
print(beta_0, beta_1)

At lave forudsigelser

Nye instanser kan nemt forudsiges ved hjælp af predict()-metoden, men inputtet skal også forbehandles for dem:


              12345
            
import numpy as np

X_new = np.array([65, 70, 75])
X_new_tilde = sm.add_constant(X_new)
print(model.predict(X_new_tilde))

Hentning af oversigt

Som du sikkert har bemærket, er brugen af OLS-klassen ikke lige så enkel som funktionen polyfit(). Men brugen af OLS har sine fordele. Under træningen beregner den en masse statistisk information. Du kan få adgang til informationen ved hjælp af summary()-metoden.


              1
            
print(model.summary())

Det er mange statistikker. Vi vil gennemgå de vigtigste dele af tabellen i senere afsnit.

Var alt klart?

Tak for dine kommentarer!

Sektion 1. Kapitel 4

Spørg AI

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Opbygning af Lineær Regression med Statsmodels