Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda R-Quadrado | Escolhendo o Melhor Modelo
Quizzes & Challenges
Quizzes
Challenges
/
Regressão Linear com Python

bookR-Quadrado

O que é R-quadrado

Já abordamos MSE, RMSE e MAE. Eles ajudam a comparar modelos, mas um único valor é difícil de avaliar sem contexto. Pode não ser claro se o valor é “bom o suficiente” para seu conjunto de dados.

R-quadrado resolve isso ao medir quanto da variância do alvo o modelo explica. Seu valor varia de 0 a 1, tornando a interpretação direta.

O problema é que não podemos calcular a variância explicada imediatamente. Mas podemos calcular a variância não explicada, então vamos transformar a equação acima para:

Variância Total

A variância total é simplesmente a variância do alvo, e podemos calcular a variância do alvo utilizando a fórmula da variância amostral da Estatística ( é a média do alvo):

No exemplo, as diferenças entre os valores reais e a média do alvo (linhas laranjas) são elevadas ao quadrado e somadas, depois divididas por m−1, resultando em uma variância total de 11.07.

Variância Não Explicada

Em seguida, calculamos a variância que o modelo não explica. Se as previsões fossem perfeitas, todos os pontos estariam exatamente sobre a linha de regressão. Calculamos a mesma fórmula de variância, mas substituímos pelos valores previstos.

Aqui está um exemplo com visualização:

Agora sabemos tudo para calcular o R-quadrado:

Obtivemos um valor de R-quadrado de 0,92, que é próximo de 1, portanto temos um ótimo modelo. Também calcularemos o R-quadrado para mais um modelo.

O R-quadrado é mais baixo, pois o modelo subajusta um pouco os dados.

R-quadrado no Python

A classe sm.OLS calcula o R-quadrado para nós. Podemos encontrá-lo na tabela summary() aqui.

O R-quadrado varia de 0 a 1, e quanto maior, melhor (a menos que o modelo superajuste). A saída summary() do sm.OLS inclui o valor do R-quadrado.

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 3

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Awesome!

Completion rate improved to 5.26

bookR-Quadrado

Deslize para mostrar o menu

O que é R-quadrado

Já abordamos MSE, RMSE e MAE. Eles ajudam a comparar modelos, mas um único valor é difícil de avaliar sem contexto. Pode não ser claro se o valor é “bom o suficiente” para seu conjunto de dados.

R-quadrado resolve isso ao medir quanto da variância do alvo o modelo explica. Seu valor varia de 0 a 1, tornando a interpretação direta.

O problema é que não podemos calcular a variância explicada imediatamente. Mas podemos calcular a variância não explicada, então vamos transformar a equação acima para:

Variância Total

A variância total é simplesmente a variância do alvo, e podemos calcular a variância do alvo utilizando a fórmula da variância amostral da Estatística ( é a média do alvo):

No exemplo, as diferenças entre os valores reais e a média do alvo (linhas laranjas) são elevadas ao quadrado e somadas, depois divididas por m−1, resultando em uma variância total de 11.07.

Variância Não Explicada

Em seguida, calculamos a variância que o modelo não explica. Se as previsões fossem perfeitas, todos os pontos estariam exatamente sobre a linha de regressão. Calculamos a mesma fórmula de variância, mas substituímos pelos valores previstos.

Aqui está um exemplo com visualização:

Agora sabemos tudo para calcular o R-quadrado:

Obtivemos um valor de R-quadrado de 0,92, que é próximo de 1, portanto temos um ótimo modelo. Também calcularemos o R-quadrado para mais um modelo.

O R-quadrado é mais baixo, pois o modelo subajusta um pouco os dados.

R-quadrado no Python

A classe sm.OLS calcula o R-quadrado para nós. Podemos encontrá-lo na tabela summary() aqui.

O R-quadrado varia de 0 a 1, e quanto maior, melhor (a menos que o modelo superajuste). A saída summary() do sm.OLS inclui o valor do R-quadrado.

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 4. Capítulo 3
some-alt