Kursinnehåll
Linjär Regression med Python
Linjär Regression med Python
Kvadratisk Regression
Problemet med linjär regression
Innan vi definierar polynomregression ska vi titta på ett fall där den linjära regressionen vi tidigare lärt oss inte fungerar bra.
Här kan du se att vår enkla linjära regressionsmodell presterar dåligt. Det beror på att den försöker anpassa en rak linje till datapunkterna. Vi kan dock märka att en parabel skulle vara ett mycket bättre val för våra punkter.
Kvadratisk regressions-ekvation
För att bygga en modell med rak linje använde vi en linjes ekvation (y=ax+b). För att bygga en parabolisk modell behöver vi parabelns ekvation. Det är den kvadratiska ekvationen: y=ax²+bx+c. Om vi byter ut a, b och c mot β får vi kvadratisk regressions-ekvation:
Modellen som denna ekvation beskriver kallas Kvadratisk Regression. Precis som tidigare behöver vi bara hitta de bästa parametrarna för våra datapunkter.
Normalekvationen och X̃
Som alltid hanterar normalequationen att hitta de bästa parametrarna. Men vi behöver definiera X̃ på rätt sätt.
Vi vet redan hur man bygger X̃-matrisen för multipel linjär regression. Det visar sig att X̃-matrisen för polynomregression konstrueras på liknande sätt. Vi kan betrakta x² som en andra variabel. På så sätt behöver vi lägga till en motsvarande ny kolumn till X̃. Den kommer att innehålla samma värden som den föregående kolumnen men upphöjda till två.
Videon nedan visar hur man bygger X̃.
Tack för dina kommentarer!