Summary  
This chapter explains how to calculate and interpret R-squared, a metric that quantifies the proportion of a target variable’s variance explained by a model by comparing total variance to unexplained variance.  

General domain of usage  
Regression model evaluation in predictive modeling.

## O que é R-quadrado

Já abordamos MSE, RMSE e MAE. Eles ajudam a comparar modelos, mas um único valor é difícil de avaliar sem contexto. Pode não ser claro se o valor é “bom o suficiente” para seu conjunto de dados.

**R-quadrado** resolve isso ao medir quanto da variância do alvo o modelo explica. Seu valor varia de 0 a 1, tornando a interpretação direta.

O problema é que não podemos calcular a variância explicada imediatamente. Mas podemos calcular a variância não explicada, então vamos transformar a equação acima para:

## Variância Total
A variância total é simplesmente a variância do alvo, e podemos calcular a variância do alvo utilizando a fórmula da variância amostral da Estatística (**ȳ** é a média do alvo):

No exemplo, as diferenças entre os valores reais e a média do alvo (linhas laranjas) são elevadas ao quadrado e somadas, depois divididas por **m−1**, resultando em uma variância total de 11.07.



## Variância Não Explicada

Em seguida, calculamos a variância que o modelo **não** explica. Se as previsões fossem perfeitas, todos os pontos estariam exatamente sobre a linha de regressão. Calculamos a mesma fórmula de variância, mas substituímos **ȳ** pelos valores previstos.

Aqui está um exemplo com visualização:

Agora sabemos tudo para calcular o R-quadrado:

Obtivemos um valor de R-quadrado de 0,92, que é próximo de 1, portanto temos um ótimo modelo. Também calcularemos o R-quadrado para mais um modelo.

O R-quadrado é mais baixo, pois o modelo subajusta um pouco os dados.

## R-quadrado no Python
A classe `sm.OLS` calcula o R-quadrado para nós. Podemos encontrá-lo na tabela `summary()` aqui.

O R-quadrado varia de 0 a 1, e quanto maior, melhor (a menos que o modelo superajuste). A saída `summary()` do `sm.OLS` inclui o valor do R-quadrado.


A Regressão Linear é um conceito fundamental em análise preditiva. É amplamente utilizada por cientistas de dados, analistas de dados e estatísticos, pois é fácil de construir e interpretar, mas poderosa o suficiente para diversas tarefas.

Vamos começar com o modelo mais simples de Regressão Linear! Você aprenderá o conceito por trás da Regressão Linear e como realizar previsões em Python.

A maioria das tarefas de previsão do mundo real envolve mais de uma variável. Você aprenderá como lidar com Regressão Linear com múltiplas variáveis.

Uma linha reta nem sempre descreve bem os dados. Vamos aprender como construir um modelo mais complexo para previsão! É para isso que a Regressão Polinomial é adequada.

Agora que você sabe como construir vários modelos de Regressão Linear, é necessário um método para escolher o melhor. Isso pode ser feito utilizando métricas. Esta seção explica as métricas mais utilizadas e as dificuldades que podem surgir ao utilizá-las.

R-Quadrado

O que é R-quadrado

Variância Total

Variância Não Explicada

R-quadrado no Python