Summary  
This chapter demonstrates how to implement a simple linear regression model by using NumPy’s polyfit function to calculate the best-fit line parameters, visualizing the data with a scatter plot and fitted line, and making predictions for new feature values.

General domain of usage  
Predicting child height from parental height data.

Sie wissen bereits, was eine einfache lineare Regression ist und wie man die am besten passende Gerade für die Daten findet. Nun werden alle Schritte zum Aufbau einer linearen Regression für einen realen Datensatz durchlaufen.

## Laden von Daten
Wir haben eine Datei, `simple_height_data.csv`, mit den Daten aus unseren Beispielen. Wir laden die Datei und sehen sie uns an:

import pandas as pd

file_link = 'https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b22d1166-efda-45e8-979e-6c3ecfc566fc/simple_height_data.csv'
df = pd.read_csv(file_link)	# Read the file

print(df.head())	# Print the first 5 instances from a dataset

Das Datenset enthält zwei Spalten: Die erste ist `'Father'`, das **Eingabemerkmal**, und die zweite ist `'Height'`, unsere **Zielvariable**.

Wir ordnen die Zielwerte der Variable `y` und die Merkmalswerte der Variable `X` zu und erstellen ein Streudiagramm.

X = df['Father']	# Assign the feature
y = df['Height']	# Assign the target
plt.scatter(X,y)	# Build scatterplot
plt.show()

## Parameterermittlung
NumPy bietet eine praktische Funktion, um die Parameter der linearen Regression zu bestimmen.

Lineare Regression ist eine Polynomregression vom Grad 1 (auf Polynomregression gehen wir in späteren Abschnitten ein). Deshalb muss `deg=1` gesetzt werden, um die Parameter für die lineare Regression zu erhalten.  
Hier ein Beispiel:

beta_1, beta_0 = np.polyfit(X, y, 1)	# Get the parameters
print('beta_0 is', beta_0)
print('beta_1 is', beta_1)

Falls Sie mit der Syntax `beta_1, beta_0 = np.polyfit(X,y,1)` nicht vertraut sind: Dies wird als Unpacking bezeichnet. Wenn ein Iterator (z. B. Liste, NumPy-Array oder pandas Series) zwei Elemente enthält, entspricht
```python
a, b = my_iterator
```
dem folgenden:
```python
a = my_iterator[0]
b = my_iterator[1]
```
Da die Rückgabe der Funktion `polyfit()` ein NumPy-Array mit zwei Werten ist, kann dies so verwendet werden.

Hinweis

## Durchführung von Vorhersagen
Nun kann die Linie geplottet und neue Variablen mithilfe der Parameter vorhergesagt werden.

plt.scatter(X,y)	# Build a scatter plot
plt.plot(X, beta_0 + beta_1 * X, color='red')	# Plot the line
plt.show()

Nachdem die Parameter bestimmt wurden, kann die Gleichung der linearen Regression zur Vorhersage neuer Werte verwendet werden.

X_new = np.array([65, 70, 75])	# Feature values of new instances
y_pred = beta_0 + beta_1 * X_new	# Predict the target
print('Predicted y: ', y_pred)

Es ist also ziemlich einfach, die Parameter der linearen Regression zu bestimmen. Einige Bibliotheken können jedoch auch zusätzliche Informationen bereitstellen.

Die Parameter der einfachen linearen Regression können mit der NumPy-Funktion gefunden werden:

Lineare Regression ist ein zentrales Konzept in der prädiktiven Analytik. Sie wird von Data Scientists, Datenanalysten und Statistikern häufig verwendet, da sie einfach zu erstellen und zu interpretieren ist, aber dennoch für viele Aufgaben ausreichend leistungsfähig bleibt.

Beginnen wir mit dem einfachsten Modell der linearen Regression. Sie lernen das Konzept der linearen Regression kennen und erfahren, wie Vorhersagen in Python getroffen werden.

Die meisten Vorhersageaufgaben in der Praxis beinhalten mehr als ein Merkmal. Sie lernen, wie man lineare Regression mit mehreren Merkmalen anwendet.

Eine Gerade beschreibt die Daten nicht immer ausreichend. Lernen Sie, wie ein komplexeres Modell für Vorhersagen erstellt werden kann. Dafür eignet sich die polynomiale Regression.

Nachdem Sie nun wissen, wie man verschiedene lineare Regressionsmodelle erstellt, benötigen Sie eine Methode, um das beste auszuwählen. Dies ist mithilfe von Metriken möglich. In diesem Abschnitt werden die am häufigsten verwendeten Metriken sowie die Herausforderungen bei deren Anwendung erläutert.

Erstellung Einer Linearen Regression Mit NumPy

Laden von Daten

Parameterermittlung

Durchführung von Vorhersagen