Grafico a Dispersione
Un diagramma a dispersione è un tipo di grafico che mostra la relazione tra due variabili (x e y) utilizzando punti o altri marcatori.
I diagrammi a dispersione sono uno degli strumenti più semplici per esaminare visivamente se due variabili sono correlate. Pur non essendo il metodo più preciso, spesso forniscono utili indicazioni a colpo d'occhio.
È simile a un grafico a linee, ad eccezione del fatto che non presenta linee, ma solo marcatori. Per creare un diagramma a dispersione, è sufficiente utilizzare la funzione scatter()
di pyplot
, passando prima i valori per l'asse x e poi quelli per l'asse y. Vediamo un esempio:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Creating a scatter plot plt.scatter(x, y) plt.show()
La sintassi della funzione scatter()
è simile a quella di plot()
. Tuttavia, a differenza di plot()
, è sempre necessario fornire valori sia per i parametri x
che y
.
In questo esempio, y
viene calcolato utilizzando la formula y = 2x + 5
. Il grafico a dispersione mostra una relazione lineare positiva — all'aumentare di x
, anche y
aumenta, e viceversa.
È inoltre possibile impostare altri marker al posto dei punti e definire la loro dimensione utilizzando rispettivamente i parametri marker
e s
:
import matplotlib.pyplot as plt import numpy as np x = np.array([6, 1, 8, 20, 13, 4, 16, 5, 11, 10]) y = 2 * x + 5 # Specifying the markers and their size plt.scatter(x, y, marker='x', s=100) plt.show()
Qui sono stati utilizzati marker 'x'
invece dei punti predefiniti 'o'
, e la loro dimensione è stata impostata a 100. È possibile modificare il parametro s
per esplorare diverse dimensioni dei marker.
La prossima sezione si concentrerà maggiormente sulla personalizzazione dei grafici, ma per ora puoi consultare la scatter()
documentazione della funzione per approfondire.
La creazione di più scatter plot può essere realizzata semplicemente chiamando la funzione scatter()
due volte con diversi argomenti x
e y
(in modo analogo ai grafici a linee).
Sebbene plt.plot(x, y, 'o')
e plt.scatter(x, y)
possano sembrare simili a prima vista, hanno scopi diversi:
plt.plot(x, y, 'o')
è una funzione per grafici a linee che utilizza'o'
per mostrare solo i marker. È veloce ma offre opzioni di stile limitate.plt.scatter(x, y)
è una funzione dedicata agli scatter plot che offre maggiore controllo — consentendo la personalizzazione individuale di dimensione, colore e trasparenza dei marker.
Swipe to start coding
Visualizzazione di una relazione quadratica tra due variabili utilizzando un grafico a dispersione:
- Sostituire gli underscore, in modo che l'array
y
contenga gli elementi dell'arrayx
elevati al quadrato. - Utilizzare la funzione corretta per creare un grafico a dispersione.
- Passare
x
ey
a questa funzione nell'ordine corretto. - Impostare la dimensione dei marker a 70.
Soluzione
Grazie per i tuoi commenti!