Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Construindo Regressão Linear Usando NumPy | Regressão Linear Simples
Regressão Linear com Python

bookConstruindo Regressão Linear Usando NumPy

Deslize para mostrar o menu

Você já conhece o que é regressão linear simples e como encontrar a linha que melhor se ajusta aos dados. Agora, você passará por todas as etapas de construção de uma regressão linear para um conjunto de dados real.

Carregando os Dados

Temos um arquivo, simple_height_data.csv, com os dados dos nossos exemplos. Vamos carregar o arquivo e analisá-lo:

123456
import pandas as pd file_link = 'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv' df = pd.read_csv(file_link) # Read the file print(df.head()) # Print the first 5 instances from a dataset
copy

O conjunto de dados possui duas colunas: a primeira é 'Father', que representa a característica de entrada, e a segunda é 'Height', que é nossa variável alvo.

Os valores alvo serão atribuídos à variável y e os valores da característica à variável X, para então construir um gráfico de dispersão.

123456
import matplotlib.pyplot as plt X = df['Father'] # Assign the feature y = df['Height'] # Assign the target plt.scatter(X,y) # Build scatterplot plt.show()
copy

Encontrando os Parâmetros

O NumPy possui uma função útil para encontrar os parâmetros da regressão linear.

A Regressão Linear é uma Regressão Polinomial de grau 1 (iremos abordar Regressão Polinomial em seções posteriores). Por isso, é necessário definir deg=1 para obter os parâmetros da regressão linear.
Veja um exemplo:

12345
import numpy as np beta_1, beta_0 = np.polyfit(X, y, 1) # Get the parameters print('beta_0 is', beta_0) print('beta_1 is', beta_1)
copy
Note
Nota

Se você não está familiarizado com a sintaxe beta_1, beta_0 = np.polyfit(X,y,1), isso é chamado de desempacotamento. Se você possui um iterador (por exemplo, lista, array do NumPy ou série do pandas) que contém dois itens, escrever

a, b = my_iterator

é equivalente a

a = my_iterator[0]
b = my_iterator[1]

E como o retorno da função polyfit() é um array do NumPy com dois valores, é permitido fazer isso.

Realizando as Previsões

Agora podemos traçar a linha e prever novas variáveis utilizando os parâmetros.

123
plt.scatter(X,y) # Build a scatter plot plt.plot(X, beta_0 + beta_1 * X, color='red') # Plot the line plt.show()
copy

Agora que temos os parâmetros, podemos usar a equação da regressão linear para prever novos valores.

123
X_new = np.array([65, 70, 75]) # Feature values of new instances y_pred = beta_0 + beta_1 * X_new # Predict the target print('Predicted y: ', y_pred)
copy

Portanto, é bastante simples obter os parâmetros da regressão linear. Porém, algumas bibliotecas também podem fornecer informações extras.

question mark

Você pode encontrar os parâmetros da Regressão Linear Simples usando a função do NumPy:

Selecione a resposta correta

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 3

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 1. Capítulo 3
some-alt