Opbygning af Lineær Regression ved Hjælp af Statsmodels
Opbygning af en lineær regressionsmodel
I statsmodels kan OLS-klassen bruges til at oprette en lineær regressionsmodel.
Først skal vi initialisere et OLS-klasseobjekt ved hjælp af
sm.OLS(y, X_tilde).
Derefter trænes modellen med metoden fit().
model = sm.OLS(y, X_tilde)
model = model.fit()
Dette svarer til:
model = sm.OLS(y, X_tilde).fit()
Konstruktøren for OLS-klassen forventer et specifikt array X_tilde som input, hvilket vi så i den normale ligning. Derfor skal du konvertere dit X-array til X_tilde. Dette kan opnås ved at bruge funktionen sm.add_constant().
Finde parametre
Når modellen er trænet, kan parametrene nemt tilgås ved hjælp af attributten params.
123456789import statsmodels.api as sm import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv') X, y = df['Father'], df['Height'] X_tilde = sm.add_constant(X) model = sm.OLS(y, X_tilde).fit() beta_0, beta_1 = model.params print(beta_0, beta_1)
Udarbejdelse af forudsigelser
Nye instanser kan nemt forudsiges ved hjælp af metoden predict(), men input skal også forbehandles for dem:
12345import numpy as np X_new = np.array([65, 70, 75]) X_new_tilde = sm.add_constant(X_new) print(model.predict(X_new_tilde))
Hentning af oversigt
Som du sikkert har bemærket, er brugen af OLS-klassen ikke lige så enkel som funktionen polyfit(). Men brugen af OLS har sine fordele. Under træningen beregner den en række statistiske oplysninger. Du kan få adgang til disse oplysninger ved hjælp af metoden summary().
1print(model.summary())
Det er mange statistikker. Vi vil gennemgå tabellens vigtigste dele i senere afsnit.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 5.26
Opbygning af Lineær Regression ved Hjælp af Statsmodels
Stryg for at vise menuen
Opbygning af en lineær regressionsmodel
I statsmodels kan OLS-klassen bruges til at oprette en lineær regressionsmodel.
Først skal vi initialisere et OLS-klasseobjekt ved hjælp af
sm.OLS(y, X_tilde).
Derefter trænes modellen med metoden fit().
model = sm.OLS(y, X_tilde)
model = model.fit()
Dette svarer til:
model = sm.OLS(y, X_tilde).fit()
Konstruktøren for OLS-klassen forventer et specifikt array X_tilde som input, hvilket vi så i den normale ligning. Derfor skal du konvertere dit X-array til X_tilde. Dette kan opnås ved at bruge funktionen sm.add_constant().
Finde parametre
Når modellen er trænet, kan parametrene nemt tilgås ved hjælp af attributten params.
123456789import statsmodels.api as sm import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv') X, y = df['Father'], df['Height'] X_tilde = sm.add_constant(X) model = sm.OLS(y, X_tilde).fit() beta_0, beta_1 = model.params print(beta_0, beta_1)
Udarbejdelse af forudsigelser
Nye instanser kan nemt forudsiges ved hjælp af metoden predict(), men input skal også forbehandles for dem:
12345import numpy as np X_new = np.array([65, 70, 75]) X_new_tilde = sm.add_constant(X_new) print(model.predict(X_new_tilde))
Hentning af oversigt
Som du sikkert har bemærket, er brugen af OLS-klassen ikke lige så enkel som funktionen polyfit(). Men brugen af OLS har sine fordele. Under træningen beregner den en række statistiske oplysninger. Du kan få adgang til disse oplysninger ved hjælp af metoden summary().
1print(model.summary())
Det er mange statistikker. Vi vil gennemgå tabellens vigtigste dele i senere afsnit.
Tak for dine kommentarer!