Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Erstellung Einer Linearen Regression Mit NumPy | Einfache Lineare Regression
Lineare Regression mit Python
course content

Kursinhalt

Lineare Regression mit Python

Lineare Regression mit Python

1. Einfache Lineare Regression
2. Multiple Lineare Regression
3. Polynomiale Regression
4. Das Beste Modell Auswählen

book
Erstellung Einer Linearen Regression Mit NumPy

Sie wissen bereits, was eine einfache lineare Regression ist und wie man die am besten passende Gerade für die Daten findet. Nun werden Sie alle Schritte zum Aufbau einer linearen Regression für einen realen Datensatz durchgehen.

Laden der Daten

Wir haben eine Datei, simple_height_data.csv, mit den Daten aus unseren Beispielen. Wir laden die Datei und sehen sie uns an:

123456
import pandas as pd file_link = 'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv' df = pd.read_csv(file_link) # Read the file print(df.head()) # Print the first 5 instances from a dataset
copy

Das Datenset enthält zwei Spalten: Die erste ist 'Father', das Eingabemerkmal, und die zweite ist 'Height', unsere Zielvariable.

Wir ordnen die Zielwerte der Variablen y und die Merkmalswerte der Variablen X zu und erstellen ein Streudiagramm.

12345678910
import pandas as pd import matplotlib.pyplot as plt file_link = 'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv' df = pd.read_csv(file_link) # Read the file X = df['Father'] # Assign the feature y = df['Height'] # Assign the target plt.scatter(X,y) # Build scatterplot plt.show()
copy

Parameterbestimmung

NumPy bietet eine praktische Funktion, um die Parameter der linearen Regression zu bestimmen.

Lineare Regression ist eine Polynomregression vom Grad 1 (auf Polynomregression gehen wir in späteren Abschnitten ein). Deshalb muss deg=1 gesetzt werden, um die Parameter für die lineare Regression zu erhalten.
Hier ein Beispiel:

12345678910
import pandas as pd import numpy as np file_link = 'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv' df = pd.read_csv(file_link) # Read the files X, y = df['Father'], df['Height'] # Assign the variables beta_1, beta_0 = np.polyfit(X, y, 1) # Get the parameters print('beta_0 is', beta_0) print('beta_1 is', beta_1)
copy
Note
Hinweis

Falls Sie mit der Syntax beta_1, beta_0 = np.polyfit(X,y,1) nicht vertraut sind: Dies wird als Unpacking bezeichnet. Wenn ein Iterator (z. B. Liste, NumPy-Array oder pandas Series) zwei Elemente enthält, entspricht

a, b = my_iterator

dem folgenden:

a = my_iterator[0]
b = my_iterator[1]

Da die Rückgabe der Funktion polyfit() ein NumPy-Array mit zwei Werten ist, kann diese Schreibweise verwendet werden.

Durchführung der Vorhersagen

Nun können wir die Gerade zeichnen und neue Variablen mithilfe der Parameter vorhersagen.

123456789101112
import pandas as pd import numpy as np import matplotlib.pyplot as plt file_link = 'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv' df = pd.read_csv(file_link) # Read the file X, y = df['Father'], df['Height'] # Assign the variables beta_1, beta_0 = np.polyfit(X, y, 1) # Get the parameters plt.scatter(X,y) # Build a scatter plot plt.plot(X, beta_0 + beta_1 * X, color='red') # Plot the line plt.show()
copy

Da wir nun die Parameter haben, können wir die Gleichung der linearen Regression verwenden, um neue Werte vorherzusagen.

1234567891011
import pandas as pd import numpy as np import matplotlib.pyplot as plt file_link = 'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv' df = pd.read_csv(file_link) # Read the file X, y = df['Father'], df['Height'] # Assign the variables beta_1, beta_0 = np.polyfit(X, y, 1) # Get the parameters X_new = np.array([65, 70, 75]) # Feature values of new instances y_pred = beta_0 + beta_1 * X_new # Predict the target print('Predicted y: ', y_pred)
copy

Es ist also ziemlich einfach, die Parameter der linearen Regression zu bestimmen. Einige Bibliotheken können jedoch auch zusätzliche Informationen bereitstellen.

question mark

Die Parameter der einfachen linearen Regression können mit der NumPy-Funktion ermittelt werden:

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 3

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

course content

Kursinhalt

Lineare Regression mit Python

Lineare Regression mit Python

1. Einfache Lineare Regression
2. Multiple Lineare Regression
3. Polynomiale Regression
4. Das Beste Modell Auswählen

book
Erstellung Einer Linearen Regression Mit NumPy

Sie wissen bereits, was eine einfache lineare Regression ist und wie man die am besten passende Gerade für die Daten findet. Nun werden Sie alle Schritte zum Aufbau einer linearen Regression für einen realen Datensatz durchgehen.

Laden der Daten

Wir haben eine Datei, simple_height_data.csv, mit den Daten aus unseren Beispielen. Wir laden die Datei und sehen sie uns an:

123456
import pandas as pd file_link = 'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv' df = pd.read_csv(file_link) # Read the file print(df.head()) # Print the first 5 instances from a dataset
copy

Das Datenset enthält zwei Spalten: Die erste ist 'Father', das Eingabemerkmal, und die zweite ist 'Height', unsere Zielvariable.

Wir ordnen die Zielwerte der Variablen y und die Merkmalswerte der Variablen X zu und erstellen ein Streudiagramm.

12345678910
import pandas as pd import matplotlib.pyplot as plt file_link = 'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv' df = pd.read_csv(file_link) # Read the file X = df['Father'] # Assign the feature y = df['Height'] # Assign the target plt.scatter(X,y) # Build scatterplot plt.show()
copy

Parameterbestimmung

NumPy bietet eine praktische Funktion, um die Parameter der linearen Regression zu bestimmen.

Lineare Regression ist eine Polynomregression vom Grad 1 (auf Polynomregression gehen wir in späteren Abschnitten ein). Deshalb muss deg=1 gesetzt werden, um die Parameter für die lineare Regression zu erhalten.
Hier ein Beispiel:

12345678910
import pandas as pd import numpy as np file_link = 'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv' df = pd.read_csv(file_link) # Read the files X, y = df['Father'], df['Height'] # Assign the variables beta_1, beta_0 = np.polyfit(X, y, 1) # Get the parameters print('beta_0 is', beta_0) print('beta_1 is', beta_1)
copy
Note
Hinweis

Falls Sie mit der Syntax beta_1, beta_0 = np.polyfit(X,y,1) nicht vertraut sind: Dies wird als Unpacking bezeichnet. Wenn ein Iterator (z. B. Liste, NumPy-Array oder pandas Series) zwei Elemente enthält, entspricht

a, b = my_iterator

dem folgenden:

a = my_iterator[0]
b = my_iterator[1]

Da die Rückgabe der Funktion polyfit() ein NumPy-Array mit zwei Werten ist, kann diese Schreibweise verwendet werden.

Durchführung der Vorhersagen

Nun können wir die Gerade zeichnen und neue Variablen mithilfe der Parameter vorhersagen.

123456789101112
import pandas as pd import numpy as np import matplotlib.pyplot as plt file_link = 'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv' df = pd.read_csv(file_link) # Read the file X, y = df['Father'], df['Height'] # Assign the variables beta_1, beta_0 = np.polyfit(X, y, 1) # Get the parameters plt.scatter(X,y) # Build a scatter plot plt.plot(X, beta_0 + beta_1 * X, color='red') # Plot the line plt.show()
copy

Da wir nun die Parameter haben, können wir die Gleichung der linearen Regression verwenden, um neue Werte vorherzusagen.

1234567891011
import pandas as pd import numpy as np import matplotlib.pyplot as plt file_link = 'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv' df = pd.read_csv(file_link) # Read the file X, y = df['Father'], df['Height'] # Assign the variables beta_1, beta_0 = np.polyfit(X, y, 1) # Get the parameters X_new = np.array([65, 70, 75]) # Feature values of new instances y_pred = beta_0 + beta_1 * X_new # Predict the target print('Predicted y: ', y_pred)
copy

Es ist also ziemlich einfach, die Parameter der linearen Regression zu bestimmen. Einige Bibliotheken können jedoch auch zusätzliche Informationen bereitstellen.

question mark

Die Parameter der einfachen linearen Regression können mit der NumPy-Funktion ermittelt werden:

Select the correct answer

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 3
some-alt