Bygge Lineær Regresjon ved Bruk av Statsmodels
Bygging av en lineær regresjonsmodell
I statsmodels kan OLS-klassen brukes til å lage en lineær regresjonsmodell.
Først må vi initialisere et objekt av OLS-klassen ved å bruke
sm.OLS(y, X_tilde).
Deretter trenes modellen ved hjelp av fit()-metoden.
model = sm.OLS(y, X_tilde)
model = model.fit()
Dette er ekvivalent med:
model = sm.OLS(y, X_tilde).fit()
Konstruktøren til OLS-klassen forventer et spesifikt array X_tilde som input, som vi så i Normal Equation. Derfor må du konvertere ditt X-array til X_tilde. Dette kan gjøres ved å bruke funksjonen sm.add_constant().
Finne parametere
Når modellen er trent, kan du enkelt få tilgang til parameterne ved å bruke attributtet params.
123456789import statsmodels.api as sm import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv') X, y = df['Father'], df['Height'] X_tilde = sm.add_constant(X) model = sm.OLS(y, X_tilde).fit() beta_0, beta_1 = model.params print(beta_0, beta_1)
Lage prediksjoner
Nye instanser kan enkelt predikeres ved å bruke metoden predict(), men du må også forhåndsprosessere inputen for disse:
12345import numpy as np X_new = np.array([65, 70, 75]) X_new_tilde = sm.add_constant(X_new) print(model.predict(X_new_tilde))
Hente sammendraget
Som du kanskje har lagt merke til, er det ikke like enkelt å bruke OLS-klassen som funksjonen polyfit(). Men det å bruke OLS har sine fordeler. Under treningen beregner den mye statistisk informasjon. Du kan få tilgang til denne informasjonen ved å bruke metoden summary().
1print(model.summary())
Det var mye statistikk. Vi vil diskutere de viktigste delene av tabellen i senere seksjoner.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 5.26
Bygge Lineær Regresjon ved Bruk av Statsmodels
Sveip for å vise menyen
Bygging av en lineær regresjonsmodell
I statsmodels kan OLS-klassen brukes til å lage en lineær regresjonsmodell.
Først må vi initialisere et objekt av OLS-klassen ved å bruke
sm.OLS(y, X_tilde).
Deretter trenes modellen ved hjelp av fit()-metoden.
model = sm.OLS(y, X_tilde)
model = model.fit()
Dette er ekvivalent med:
model = sm.OLS(y, X_tilde).fit()
Konstruktøren til OLS-klassen forventer et spesifikt array X_tilde som input, som vi så i Normal Equation. Derfor må du konvertere ditt X-array til X_tilde. Dette kan gjøres ved å bruke funksjonen sm.add_constant().
Finne parametere
Når modellen er trent, kan du enkelt få tilgang til parameterne ved å bruke attributtet params.
123456789import statsmodels.api as sm import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv') X, y = df['Father'], df['Height'] X_tilde = sm.add_constant(X) model = sm.OLS(y, X_tilde).fit() beta_0, beta_1 = model.params print(beta_0, beta_1)
Lage prediksjoner
Nye instanser kan enkelt predikeres ved å bruke metoden predict(), men du må også forhåndsprosessere inputen for disse:
12345import numpy as np X_new = np.array([65, 70, 75]) X_new_tilde = sm.add_constant(X_new) print(model.predict(X_new_tilde))
Hente sammendraget
Som du kanskje har lagt merke til, er det ikke like enkelt å bruke OLS-klassen som funksjonen polyfit(). Men det å bruke OLS har sine fordeler. Under treningen beregner den mye statistisk informasjon. Du kan få tilgang til denne informasjonen ved å bruke metoden summary().
1print(model.summary())
Det var mye statistikk. Vi vil diskutere de viktigste delene av tabellen i senere seksjoner.
Takk for tilbakemeldingene dine!