Conteúdo do Curso
Regressão Linear com Python
Regressão Linear com Python
Encontrando os Parâmetros
Agora sabemos que a Regressão Linear é simplesmente uma linha que melhor se ajusta aos dados. Mas como identificar qual é a linha correta?
Você pode calcular a diferença entre o valor previsto e o valor real do alvo para cada ponto de dados no conjunto de treinamento.
Essas diferenças são chamadas de resíduos (ou erros). O objetivo é tornar os resíduos o menor possível.
Mínimos Quadrados Ordinários
A abordagem padrão é o método dos Mínimos Quadrados Ordinários (OLS):
Pegue cada resíduo, eleve ao quadrado (principalmente para eliminar o sinal do resíduo) e some todos eles.
Isso é chamado de SSR (Soma dos resíduos ao quadrado). A tarefa é encontrar os parâmetros que minimizam o SSR.
Equação Normal
Felizmente, não precisamos testar todas as retas e calcular o SSR para cada uma delas. A tarefa de minimizar o SSR possui uma solução matemática que não é muito custosa computacionalmente.
Essa solução é chamada de Equação Normal.
Essa equação nos fornece os parâmetros de uma reta com o menor SSR.
Não entendeu como ela funciona? Sem problemas! É uma matemática bastante complexa. Mas não é necessário calcular os parâmetros manualmente. Muitas bibliotecas já implementaram a regressão linear.
Quiz
1. Considere a imagem acima. Qual linha de regressão é melhor?
2. y_true - y_predicted
é chamado de
Obrigado pelo seu feedback!