Contenuti del Corso
Regressione Lineare con Python
Regressione Lineare con Python
Trovare i Parametri
Ora sappiamo che la Regressione Lineare è semplicemente una retta che si adatta meglio ai dati. Ma come si può determinare quale sia quella corretta?
È possibile calcolare la differenza tra il valore previsto e il valore reale del target per ciascun punto dati nel set di addestramento.
Queste differenze sono chiamate residui (o errori). L'obiettivo è rendere i residui il più piccoli possibile.
Minimi Quadrati Ordinari
L'approccio predefinito è il metodo dei Minimi Quadrati Ordinari (OLS):
Si prende ciascun residuo, lo si eleva al quadrato (principalmente per eliminare il segno del residuo) e si sommano tutti.
Questo è chiamato SSR (Somma dei residui quadratici). Il compito è trovare i parametri che minimizzano la SSR.
Equazione Normale
Fortunatamente, non è necessario provare tutte le rette e calcolare l'SSR per ciascuna di esse. Il compito di minimizzare l'SSR ha una soluzione matematica che non è molto onerosa dal punto di vista computazionale.
Questa soluzione è chiamata Equazione Normale.
Questa equazione ci fornisce i parametri di una retta con il minor SSR.
Non hai capito come funziona? Nessun problema! Si tratta di una matematica piuttosto complessa. Ma non è necessario calcolare i parametri manualmente. Molte librerie hanno già implementato la regressione lineare.
Quiz
1. Considera l'immagine sopra. Quale retta di regressione è migliore?
2. y_true - y_predicted
è chiamato
Grazie per i tuoi commenti!