Kursinnehåll
Linjär Regression med Python
Linjär Regression med Python
Hitta Parametrarna
Vi vet nu att linjär regression är en linje som bäst passar data. Men hur kan du avgöra vilken som är den rätta?
Du kan beräkna skillnaden mellan det förutsagda värdet och det faktiska mål-värdet för varje datapunkt i träningsmängden.
Dessa skillnader kallas residualer (eller fel). Målet är att göra residualerna så små som möjligt.
Ordinary Least Squares
Standardmetoden är Ordinary Least Squares (OLS):
Ta varje residual, kvadrera den (främst för att eliminera tecknet på en residual), och summera alla.
Detta kallas SSR (Sum of squared residuals). Uppgiften är att hitta de parametrar som minimerar SSR.
Normalekvationen
Lyckligtvis behöver vi inte prova alla linjer och beräkna SSR för dem. Uppgiften att minimera SSR har en matematisk lösning som inte är särskilt beräkningsintensiv.
Denna lösning kallas Normalekvationen.
Denna ekvation ger oss parametrarna för en linje med lägst SSR.
Förstod du inte hur det fungerar? Ingen fara! Det är ganska komplex matematik. Men du behöver inte beräkna parametrarna för hand. Många bibliotek har redan implementerat linjär regression.
Quiz
1. Titta på bilden ovan. Vilken regressionslinje är bättre?
2. y_true - y_predicted
kallas
Tack för dina kommentarer!