Spreidingsdiagram
Een spreidingsdiagram is een type grafiek die de relatie tussen twee variabelen (x en y) weergeeft met behulp van punten of andere markeringen.
Spreidingsdiagrammen behoren tot de eenvoudigste hulpmiddelen om visueel te onderzoeken of er een correlatie bestaat tussen twee variabelen. Hoewel het niet de meest nauwkeurige methode is, bieden ze vaak direct nuttig inzicht.
Het lijkt op een lijndiagram, met als verschil dat er geen lijnen zijn, alleen markeringen. Om een spreidingsdiagram te maken, gebruik je de scatter()
-functie van pyplot
, waarbij je eerst de waarden voor de x-as en vervolgens de waarden voor de y-as doorgeeft. Bekijk het volgende voorbeeld:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Creating a scatter plot plt.scatter(x, y) plt.show()
De syntaxis van de functie scatter()
lijkt op die van plot()
. In tegenstelling tot plot()
moet je echter altijd waarden opgeven voor zowel de parameters x
als y
.
In dit voorbeeld wordt y
berekend met de formule y = 2x + 5
. De scatterplot toont een positieve lineaire relatie — naarmate x
groter wordt, neemt y
ook toe, en omgekeerd.
Het is ook mogelijk om andere markeringen dan stippen te gebruiken en hun grootte in te stellen met respectievelijk de parameters marker
en s
:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Specifying the markers and their size plt.scatter(x, y, marker='x', s=100) plt.show()
Hier zijn 'x'
-markeringen gebruikt in plaats van de standaard 'o'
(stippen), en hun grootte is ingesteld op 100. Je kunt de parameter s
aanpassen om verschillende markeringsgroottes te verkennen.
Het volgende gedeelte richt zich meer op het aanpassen van grafieken, maar voor nu kun je de scatter()
functiedocumentatie raadplegen om meer te ontdekken.
Het plotten van meerdere scatterplots kan eenvoudig worden uitgevoerd door de functie scatter()
twee keer aan te roepen met verschillende x
- en y
-argumenten (vergelijkbaar met lijngrafieken).
Hoewel plt.plot(x, y, 'o')
en plt.scatter(x, y)
op het eerste gezicht vergelijkbaar lijken, hebben ze verschillende doeleinden:
plt.plot(x, y, 'o')
is een lijngrafiekfunctie die'o'
gebruikt om alleen markeringen weer te geven. Dit is snel, maar biedt beperkte opmaakmogelijkheden.plt.scatter(x, y)
is een specifieke scatterplotfunctie die meer controle biedt — zoals individuele aanpassing van marker-grootte, kleur en transparantie.
Swipe to start coding
Toon een kwadratisch verband tussen twee variabelen met behulp van een scatterplot:
- Vervang de underscores zodat de
y
-array de gekwadrateerde elementen van dex
-array bevat. - Gebruik de juiste functie om een scatterplot te maken.
- Geef
x
eny
in de juiste volgorde door aan deze functie. - Stel de grootte van de markers in op 70.
Oplossing
Bedankt voor je feedback!