R-Quadrado
O que é R-quadrado
Já abordamos MSE, RMSE e MAE. Eles ajudam a comparar modelos, mas um único valor é difícil de avaliar sem contexto. Pode não ser claro se o valor é “bom o suficiente” para seu conjunto de dados.
R-quadrado resolve isso ao medir quanto da variância do alvo o modelo explica. Seu valor varia de 0 a 1, tornando a interpretação direta.
O problema é que não podemos calcular a variância explicada imediatamente. Mas podemos calcular a variância não explicada, então vamos transformar a equação acima para:
Variância Total
A variância total é simplesmente a variância do alvo, e podemos calcular a variância do alvo utilizando a fórmula da variância amostral da Estatística (ȳ é a média do alvo):
No exemplo, as diferenças entre os valores reais e a média do alvo (linhas laranjas) são elevadas ao quadrado e somadas, depois divididas por m−1, resultando em uma variância total de 11.07.
Variância Não Explicada
Em seguida, calculamos a variância que o modelo não explica. Se as previsões fossem perfeitas, todos os pontos estariam exatamente sobre a linha de regressão. Calculamos a mesma fórmula de variância, mas substituímos ȳ pelos valores previstos.
Aqui está um exemplo com visualização:
Agora sabemos tudo para calcular o R-quadrado:
Obtivemos um valor de R-quadrado de 0,92, que é próximo de 1, portanto temos um ótimo modelo. Também calcularemos o R-quadrado para mais um modelo.
O R-quadrado é mais baixo, pois o modelo subajusta um pouco os dados.
R-quadrado no Python
A classe sm.OLS calcula o R-quadrado para nós. Podemos encontrá-lo na tabela summary() aqui.
O R-quadrado varia de 0 a 1, e quanto maior, melhor (a menos que o modelo superajuste). A saída summary() do sm.OLS inclui o valor do R-quadrado.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 5.26
R-Quadrado
Deslize para mostrar o menu
O que é R-quadrado
Já abordamos MSE, RMSE e MAE. Eles ajudam a comparar modelos, mas um único valor é difícil de avaliar sem contexto. Pode não ser claro se o valor é “bom o suficiente” para seu conjunto de dados.
R-quadrado resolve isso ao medir quanto da variância do alvo o modelo explica. Seu valor varia de 0 a 1, tornando a interpretação direta.
O problema é que não podemos calcular a variância explicada imediatamente. Mas podemos calcular a variância não explicada, então vamos transformar a equação acima para:
Variância Total
A variância total é simplesmente a variância do alvo, e podemos calcular a variância do alvo utilizando a fórmula da variância amostral da Estatística (ȳ é a média do alvo):
No exemplo, as diferenças entre os valores reais e a média do alvo (linhas laranjas) são elevadas ao quadrado e somadas, depois divididas por m−1, resultando em uma variância total de 11.07.
Variância Não Explicada
Em seguida, calculamos a variância que o modelo não explica. Se as previsões fossem perfeitas, todos os pontos estariam exatamente sobre a linha de regressão. Calculamos a mesma fórmula de variância, mas substituímos ȳ pelos valores previstos.
Aqui está um exemplo com visualização:
Agora sabemos tudo para calcular o R-quadrado:
Obtivemos um valor de R-quadrado de 0,92, que é próximo de 1, portanto temos um ótimo modelo. Também calcularemos o R-quadrado para mais um modelo.
O R-quadrado é mais baixo, pois o modelo subajusta um pouco os dados.
R-quadrado no Python
A classe sm.OLS calcula o R-quadrado para nós. Podemos encontrá-lo na tabela summary() aqui.
O R-quadrado varia de 0 a 1, e quanto maior, melhor (a menos que o modelo superajuste). A saída summary() do sm.OLS inclui o valor do R-quadrado.
Obrigado pelo seu feedback!