Creazione di Grafici a Dispersione
Perché utilizzare i grafici a dispersione?
Un grafico a dispersione è ideale per visualizzare le relazioni tra variabili. Può essere utilizzato per:
- Mostrare le relazioni tra due variabili numeriche;
- Individuare pattern, cluster o valori anomali;
- Esplorare la correlazione (positiva/negativa/assenza).
Sintassi del grafico a dispersione in ggplot2
È possibile creare un grafico a dispersione con geom_point()
. Per farlo, specificare le estetiche sia per l'asse x
che per l'asse y
.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Per distinguere i gruppi all'interno dei dati, è possibile aggiungere una variabile di raggruppamento all'estetica color
. Questo assegna colori diversi a ciascun gruppo, facilitando l'individuazione dei pattern.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Esempio: Prezzo di vendita vs. Chilometri percorsi
Un grafico a dispersione può essere utilizzato per esaminare come l'utilizzo di un'auto sia correlato al suo prezzo di vendita. In questo esempio, l'asse x mostra il numero di chilometri percorsi, mentre l'asse y mostra il prezzo di vendita.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Questa visualizzazione spesso evidenzia le tendenze di deprezzamento: all'aumentare del chilometraggio, il prezzo di vendita tende a diminuire. Può anche rivelare valori anomali, come auto con prezzi insolitamente alti nonostante un chilometraggio elevato.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 4
Creazione di Grafici a Dispersione
Scorri per mostrare il menu
Perché utilizzare i grafici a dispersione?
Un grafico a dispersione è ideale per visualizzare le relazioni tra variabili. Può essere utilizzato per:
- Mostrare le relazioni tra due variabili numeriche;
- Individuare pattern, cluster o valori anomali;
- Esplorare la correlazione (positiva/negativa/assenza).
Sintassi del grafico a dispersione in ggplot2
È possibile creare un grafico a dispersione con geom_point()
. Per farlo, specificare le estetiche sia per l'asse x
che per l'asse y
.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Per distinguere i gruppi all'interno dei dati, è possibile aggiungere una variabile di raggruppamento all'estetica color
. Questo assegna colori diversi a ciascun gruppo, facilitando l'individuazione dei pattern.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Esempio: Prezzo di vendita vs. Chilometri percorsi
Un grafico a dispersione può essere utilizzato per esaminare come l'utilizzo di un'auto sia correlato al suo prezzo di vendita. In questo esempio, l'asse x mostra il numero di chilometri percorsi, mentre l'asse y mostra il prezzo di vendita.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Questa visualizzazione spesso evidenzia le tendenze di deprezzamento: all'aumentare del chilometraggio, il prezzo di vendita tende a diminuire. Può anche rivelare valori anomali, come auto con prezzi insolitamente alti nonostante un chilometraggio elevato.
Grazie per i tuoi commenti!