Spredningsdiagram
Et scatter plot er en type plot, der viser forholdet mellem to variable (x og y) ved hjælp af prikker eller andre markører.
Scatter plots er et af de enkleste værktøjer til visuelt at undersøge, om to variable er korrelerede. Selvom det ikke er den mest præcise metode, giver det ofte nyttig indsigt ved første øjekast.
Det ligner et line plot, bortset fra at det ikke har nogen linjer, kun markører. For at oprette et scatter plot skal du blot bruge funktionen scatter()
fra pyplot
, hvor du først angiver værdierne for x-aksen og derefter værdierne for y-aksen. Lad os se på et eksempel:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Creating a scatter plot plt.scatter(x, y) plt.show()
Syntaksen for funktionen scatter()
ligner den for plot()
. Men i modsætning til plot()
skal du altid angive værdier for både x
- og y
-parametrene.
I dette eksempel beregnes y
ved hjælp af formlen y = 2x + 5
. Scatter-plottet viser en positiv lineær sammenhæng — når x
bliver større, stiger y
også, og omvendt.
Det er også muligt at vælge andre markører end prikker og angive deres størrelse ved hjælp af henholdsvis parametrene marker
og s
:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Specifying the markers and their size plt.scatter(x, y, marker='x', s=100) plt.show()
Her blev 'x'
-markører brugt i stedet for standarden 'o'
(prikker), og deres størrelse blev sat til 100. Du kan justere s
-parameteren for at undersøge forskellige markørstørrelser.
Det næste afsnit vil fokusere mere på tilpasning af plots, men indtil videre kan du bruge scatter()
-funktionsdokumentationen for at udforske mere.
Plotning af flere scatter plots kan nemt udføres ved at kalde scatter()
-funktionen to gange med forskellige x
- og y
-argumenter (på samme måde som ved linjeplots).
Selvom plt.plot(x, y, 'o')
og plt.scatter(x, y)
umiddelbart kan se ens ud, tjener de forskellige formål:
plt.plot(x, y, 'o')
er en linjeplotfunktion, der bruger'o'
til kun at vise markører. Det er hurtigt, men tilbyder begrænsede stylingmuligheder.plt.scatter(x, y)
er en dedikeret scatter plot-funktion, der giver mere kontrol — herunder individuel tilpasning af markørstørrelse, farve og gennemsigtighed.
Swipe to start coding
Vis en kvadratisk sammenhæng mellem to variable ved hjælp af et scatter plot:
- Udskift understregningerne, så
y
-arrayet indeholder de kvadrerede elementer frax
-arrayet. - Brug den korrekte funktion til at oprette et scatter plot.
- Indsæt
x
ogy
i denne funktion i den rigtige rækkefølge. - Angiv markørernes størrelse til 70.
Løsning
Tak for dine kommentarer!