Streudiagramm
Ein Streudiagramm ist eine Diagrammart, die die Beziehung zwischen zwei Variablen (x und y) mithilfe von Punkten oder anderen Markierungen darstellt.
Streudiagramme gehören zu den einfachsten Werkzeugen, um visuell zu überprüfen, ob zwei Variablen korreliert sind. Obwohl sie nicht die präziseste Methode darstellen, liefern sie oft auf einen Blick nützliche Erkenntnisse.
Sie ähneln einem Liniendiagramm, jedoch ohne Linien, sondern nur mit Markierungen. Um ein Streudiagramm zu erstellen, verwendet man einfach die Funktion scatter()
aus pyplot
, wobei zuerst die Werte für die x-Achse und dann die Werte für die y-Achse übergeben werden. Sehen wir uns ein Beispiel an:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Creating a scatter plot plt.scatter(x, y) plt.show()
Die Syntax der Funktion scatter()
ähnelt der von plot()
. Im Gegensatz zu plot()
müssen jedoch immer Werte für beide Parameter x
und y
angegeben werden.
In diesem Beispiel wird y
mit der Formel y = 2x + 5
berechnet. Das Streudiagramm zeigt eine positive lineare Beziehung – wenn x
größer wird, steigt auch y
, und umgekehrt.
Es ist außerdem möglich, andere Marker anstelle von Punkten zu verwenden und deren Größe mit den Parametern marker
bzw. s
festzulegen:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Specifying the markers and their size plt.scatter(x, y, marker='x', s=100) plt.show()
Hier wurden 'x'
-Marker anstelle der Standard-'o'
(Punkte) verwendet und deren Größe auf 100 gesetzt. Der Parameter s
kann angepasst werden, um verschiedene Markierungsgrößen auszuprobieren.
Der nächste Abschnitt konzentriert sich stärker auf die Anpassung von Diagrammen. Bis dahin kann die scatter()
-Funktionsdokumentation genutzt werden, um weitere Möglichkeiten zu entdecken.
Das Erstellen von mehreren Streudiagrammen kann einfach durch zweimaliges Aufrufen der Funktion scatter()
mit unterschiedlichen x
- und y
-Argumenten erfolgen (ähnlich wie bei Liniendiagrammen).
Obwohl plt.plot(x, y, 'o')
und plt.scatter(x, y)
auf den ersten Blick ähnlich erscheinen, erfüllen sie unterschiedliche Zwecke:
plt.plot(x, y, 'o')
ist eine Liniendiagramm-Funktion, die'o'
verwendet, um nur Marker darzustellen. Sie ist schnell, bietet aber eingeschränkte Gestaltungsmöglichkeiten.plt.scatter(x, y)
ist eine spezielle Streudiagramm-Funktion, die mehr Kontrolle ermöglicht — einschließlich individueller Anpassung von Markierungsgröße, Farbe und Transparenz.
Swipe to start coding
Darstellung einer quadratischen Beziehung zwischen zwei Variablen mit einem Streudiagramm:
- Ersetzen Sie die Unterstriche, sodass das
y
-Array die quadrierten Elemente desx
-Arrays enthält. - Verwenden Sie die korrekte Funktion, um ein Streudiagramm zu erstellen.
- Übergeben Sie
x
undy
in dieser Funktion in der richtigen Reihenfolge. - Legen Sie die Markierungsgröße auf 70 fest.
Lösung
Danke für Ihr Feedback!