Spredningsdiagram
Et spredningsdiagram er en type diagram som viser forholdet mellom to variabler (x og y) ved hjelp av prikker eller andre markører.
Spredningsdiagrammer er et av de enkleste verktøyene for å visuelt undersøke om to variabler er korrelert. Selv om det ikke er den mest presise metoden, gir de ofte nyttig innsikt ved første øyekast.
Det ligner på et linjediagram, bortsett fra at det ikke har linjer, kun markører. For å lage et spredningsdiagram, bruker du bare funksjonen scatter()
fra pyplot
, hvor du først oppgir verdier for x-aksen, deretter verdier for y-aksen. La oss se på et eksempel:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Creating a scatter plot plt.scatter(x, y) plt.show()
Syntaksen til scatter()
-funksjonen ligner på den for plot()
. Men i motsetning til plot()
, må du alltid oppgi verdier for både x
- og y
-parametrene.
I dette eksemplet beregnes y
ved hjelp av formelen y = 2x + 5
. Spredningsdiagrammet viser en positiv lineær sammenheng — når x
øker, øker også y
, og omvendt.
Det er også mulig å angi andre markører i stedet for prikker og angi størrelsen deres ved å bruke henholdsvis parameterne marker
og s
:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Specifying the markers and their size plt.scatter(x, y, marker='x', s=100) plt.show()
Her ble 'x'
-markører brukt i stedet for standard 'o'
(prikker), og størrelsen ble satt til 100. Du kan justere s
-parameteren for å utforske ulike markørstørrelser.
Neste seksjon vil fokusere mer på tilpasning av plott, men foreløpig kan du bruke scatter()
-funksjonens dokumentasjon for å utforske mer.
Å lage flere spredningsplott kan enkelt gjøres ved å kalle scatter()
-funksjonen to ganger med ulike x
- og y
-argumenter (på samme måte som for linjeplott).
Selv om plt.plot(x, y, 'o')
og plt.scatter(x, y)
kan se like ut ved første øyekast, har de ulike formål:
plt.plot(x, y, 'o')
er en linjeplott-funksjon som bruker'o'
for kun å vise markører. Dette er raskt, men gir begrensede muligheter for stilvalg.plt.scatter(x, y)
er en dedikert spredningsplott-funksjon som gir mer kontroll — og gjør det mulig å tilpasse markørstørrelse, farge og gjennomsiktighet individuelt.
Swipe to start coding
Vis en kvadratisk sammenheng mellom to variabler ved hjelp av et spredningsdiagram:
- Erstatt understrekene slik at
y
-arrayen inneholder kvadrerte elementer frax
-arrayen. - Bruk riktig funksjon for å lage et spredningsdiagram.
- Send inn
x
ogy
til denne funksjonen i riktig rekkefølge. - Sett størrelsen på markørene til 70.
Løsning
Takk for tilbakemeldingene dine!