Summary  
This chapter explains how to calculate and interpret R-squared, a metric that quantifies the proportion of a target variable’s variance explained by a model by comparing total variance to unexplained variance.  

General domain of usage  
Regression model evaluation in predictive modeling.

## Cos'è R-quadro

Abbiamo già trattato MSE, RMSE e MAE. Questi aiutano a confrontare i modelli, ma un singolo punteggio è difficile da valutare senza contesto. Potresti non sapere se il valore è “sufficientemente buono” per il tuo dataset.

**R-quadro** risolve questo problema misurando quanta parte della varianza del target viene spiegata dal modello. Il suo valore varia da 0 a 1, rendendo l'interpretazione immediata.

Il problema è che non possiamo calcolare immediatamente la varianza spiegata. Tuttavia, possiamo calcolare la varianza non spiegata, quindi trasformeremo l'equazione sopra in:

## Varianza Totale
La varianza totale è semplicemente la varianza del target, e possiamo calcolare la varianza del target utilizzando la formula della varianza campionaria dalla Statistica (**ȳ** è la media del target):

Nell'esempio, le differenze tra i valori reali e la media del target (linee arancioni) vengono elevate al quadrato e sommate, poi divise per **m−1**, ottenendo una varianza totale di 11.07.



## Varianza Non Spiegata

Successivamente si calcola la varianza che il modello **non** spiega. Se le previsioni fossero perfette, tutti i punti si troverebbero esattamente sulla retta di regressione. Si utilizza la stessa formula della varianza, ma si sostituisce **ȳ** con i valori previsti.

Ora conosciamo tutto il necessario per calcolare il coefficiente di determinazione R-quadro:

Abbiamo ottenuto un valore R-quadro di 0,92, che è vicino a 1, quindi il modello è ottimo. Calcoleremo inoltre il coefficiente R-quadro per un altro modello.

Il valore R-quadro è più basso poiché il modello sottostima leggermente i dati.

## R-quadro in Python
La classe `sm.OLS` calcola per noi il valore R-quadro. Possiamo trovarlo nella tabella `summary()` qui.

Il valore R-quadro varia da 0 a 1, e valori più alti sono preferibili (a meno che il modello non sia sovradattato). L'output `summary()` di `sm.OLS` include il punteggio R-quadro.


La regressione lineare è un concetto fondamentale nell'analisi predittiva. È ampiamente utilizzata da data scientist, analisti di dati e statistici poiché è facile da costruire e interpretare, ma abbastanza potente per molti compiti.

Iniziamo con il modello di Regressione Lineare più semplice. Verranno illustrate le basi della Regressione Lineare e come effettuare previsioni in Python.

La maggior parte delle attività di previsione nel mondo reale coinvolge più di una caratteristica. Verrà illustrato come gestire la regressione lineare con più caratteristiche.

Una retta non descrive sempre adeguatamente i dati. Impariamo come costruire un modello più complesso per la previsione. Questo è l'obiettivo della Regressione Polinomiale.

Ora che sai come costruire diversi modelli di Regressione Lineare, è necessario un metodo per selezionare il migliore. Questo è possibile utilizzando le metriche. Questa sezione illustra le metriche più utilizzate e le difficoltà che si possono incontrare nel loro impiego.

R-Quadro

Cos'è R-quadro

Varianza Totale

Varianza Non Spiegata

R-quadro in Python