Conteúdo do Curso
Linear Regression with Python
4. Escolhendo o Melhor Modelo
Linear Regression with Python
Interpolação vs Extrapolação
No capítulo anterior, percebemos que nossas previsões utilizando diferentes modelos estão se tornando mais variadas nas bordas.
Para ser mais preciso, as previsões estão se tornando estranhas no momento em que ultrapassamos a faixa de valores do conjunto de treinamento. Prever valores fora do alcance do conjunto de treinamento é chamado de extrapolação, e prever valores dentro do alcance é interpolação.
A regressão não lida bem com a extrapolação. Ela é utilizada para interpolação e pode gerar previsões absurdas quando novas instâncias estão fora do alcance do conjunto de treinamento.
Intervalos de confiança
Utilizando a classe OLS
, você também pode obter os intervalos de confiança para a linha de regressão em qualquer ponto. No entanto, a sintaxe é um pouco complicada:
Onde alpha
é o nível de confiança, geralmente definido como 0.05
.
Usando o código acima, você obterá os limites inferior e superior do intervalo de confiança da linha de regressão no ponto X_new_tilde
(ou um conjunto de limites superiores e inferiores, se X_new_tilde
for um conjunto).
Vamos utilizá-lo para traçar a linha de regressão juntamente com o seu intervalo de confiança.
Sem conhecer a distribuição de um alvo, não podemos determinar a linha de regressão exata. Tudo o que fazemos é tentar aproximá-la com base em nossos dados. O intervalo de confiança da linha de regressão é o intervalo no qual a linha de regressão exata se encontra com um nível de confiança alpha
.
Você pode notar que o intervalo se torna maior e maior à medida que se afasta do alcance do conjunto de treinamento.
Nota
Os intervalos de confiança são construídos assumindo que escolhemos corretamente o modelo (por exemplo, Regressão Linear Simples ou Regressão Polinomial de grau 4).
Se o modelo for escolhido de forma inadequada, o intervalo de confiança será pouco confiável, assim como a própria linha. Você aprenderá como selecionar o melhor modelo na próxima seção.
Tudo estava claro?
Conteúdo do Curso
Linear Regression with Python
4. Escolhendo o Melhor Modelo
Linear Regression with Python
Interpolação vs Extrapolação
No capítulo anterior, percebemos que nossas previsões utilizando diferentes modelos estão se tornando mais variadas nas bordas.
Para ser mais preciso, as previsões estão se tornando estranhas no momento em que ultrapassamos a faixa de valores do conjunto de treinamento. Prever valores fora do alcance do conjunto de treinamento é chamado de extrapolação, e prever valores dentro do alcance é interpolação.
A regressão não lida bem com a extrapolação. Ela é utilizada para interpolação e pode gerar previsões absurdas quando novas instâncias estão fora do alcance do conjunto de treinamento.
Intervalos de confiança
Utilizando a classe OLS
, você também pode obter os intervalos de confiança para a linha de regressão em qualquer ponto. No entanto, a sintaxe é um pouco complicada:
Onde alpha
é o nível de confiança, geralmente definido como 0.05
.
Usando o código acima, você obterá os limites inferior e superior do intervalo de confiança da linha de regressão no ponto X_new_tilde
(ou um conjunto de limites superiores e inferiores, se X_new_tilde
for um conjunto).
Vamos utilizá-lo para traçar a linha de regressão juntamente com o seu intervalo de confiança.
Sem conhecer a distribuição de um alvo, não podemos determinar a linha de regressão exata. Tudo o que fazemos é tentar aproximá-la com base em nossos dados. O intervalo de confiança da linha de regressão é o intervalo no qual a linha de regressão exata se encontra com um nível de confiança alpha
.
Você pode notar que o intervalo se torna maior e maior à medida que se afasta do alcance do conjunto de treinamento.
Nota
Os intervalos de confiança são construídos assumindo que escolhemos corretamente o modelo (por exemplo, Regressão Linear Simples ou Regressão Polinomial de grau 4).
Se o modelo for escolhido de forma inadequada, o intervalo de confiança será pouco confiável, assim como a própria linha. Você aprenderá como selecionar o melhor modelo na próxima seção.
Tudo estava claro?