Finne Parameterne
Vi vet nå at lineær regresjon er en linje som best mulig tilpasser dataene. Men hvordan kan du avgjøre hvilken som er den riktige?
Du kan beregne forskjellen mellom den predikerte verdien og den faktiske målverdien for hvert datapunkt i treningssettet.
Disse forskjellene kalles residualer (eller feil). Målet er å gjøre residualene så små som mulig.
Ordinær minste kvadraters metode
Standardmetoden er Ordinær minste kvadraters metode (OLS):
Ta hver residual, kvadrer den (hovedsakelig for å eliminere fortegnet til residualen), og summer alle sammen.
Dette kalles SSR (Sum of squared residuals). Oppgaven er å finne parameterne som minimerer SSR.
Normal likning
Heldigvis trenger vi ikke å prøve alle linjene og beregne SSR for dem. Oppgaven med å minimere SSR har en matematisk løsning som ikke er særlig ressurskrevende.
Denne løsningen kalles Normal likning.
Hvor:
- β0,β1,…,βn – er modellens parametere;
- X – er en matrise med egenskapsverdier fra treningssettet;
- Xk – er elementvis opphøyd i $k$ av $X$-matrisen;
- ytrue – er en matrise med målverdier fra treningssettet.
Denne likningen gir oss parameterne til en linje med lavest mulig SSR.
Forsto du ikke hvordan det fungerer? Ikke bekymre deg! Dette er ganske avansert matematikk. Men du trenger ikke å regne ut parameterne for hånd. Mange biblioteker har allerede implementert lineær regresjon.
Quiz
1. Se på bildet ovenfor. Hvilken regresjonslinje er best?
2. y_true - y_predicted kalles
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Fantastisk!
Completion rate forbedret til 3.33
Finne Parameterne
Sveip for å vise menyen
Vi vet nå at lineær regresjon er en linje som best mulig tilpasser dataene. Men hvordan kan du avgjøre hvilken som er den riktige?
Du kan beregne forskjellen mellom den predikerte verdien og den faktiske målverdien for hvert datapunkt i treningssettet.
Disse forskjellene kalles residualer (eller feil). Målet er å gjøre residualene så små som mulig.
Ordinær minste kvadraters metode
Standardmetoden er Ordinær minste kvadraters metode (OLS):
Ta hver residual, kvadrer den (hovedsakelig for å eliminere fortegnet til residualen), og summer alle sammen.
Dette kalles SSR (Sum of squared residuals). Oppgaven er å finne parameterne som minimerer SSR.
Normal likning
Heldigvis trenger vi ikke å prøve alle linjene og beregne SSR for dem. Oppgaven med å minimere SSR har en matematisk løsning som ikke er særlig ressurskrevende.
Denne løsningen kalles Normal likning.
Hvor:
- β0,β1,…,βn – er modellens parametere;
- X – er en matrise med egenskapsverdier fra treningssettet;
- Xk – er elementvis opphøyd i $k$ av $X$-matrisen;
- ytrue – er en matrise med målverdier fra treningssettet.
Denne likningen gir oss parameterne til en linje med lavest mulig SSR.
Forsto du ikke hvordan det fungerer? Ikke bekymre deg! Dette er ganske avansert matematikk. Men du trenger ikke å regne ut parameterne for hånd. Mange biblioteker har allerede implementert lineær regresjon.
Quiz
1. Se på bildet ovenfor. Hvilken regresjonslinje er best?
2. y_true - y_predicted kalles
Takk for tilbakemeldingene dine!