Visualizzazione delle Correlazioni con Heatmap
Le matrici di correlazione possono risultare difficili da interpretare semplicemente osservando i numeri. Le heatmap offrono un modo visivo per comprendere l'intensità e la direzione delle relazioni tra variabili.
Perché utilizzare una heatmap di correlazione?
Una heatmap di correlazione fornisce un metodo visivo per esaminare le relazioni tra variabili numeriche. Utilizzando i colori per rappresentare l'intensità e la direzione delle correlazioni, diventa molto più semplice identificare associazioni forti o deboli a colpo d'occhio. Questo è particolarmente utile quando si lavora con molte variabili, poiché consente di individuare rapidamente schemi, evidenziare la multicollinearità e guidare ulteriori analisi.
Visualizzazione della matrice di correlazione con una heatmap
Per prima cosa, è necessario creare una matrice di correlazione da visualizzare:
# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")
Successivamente, è possibile utilizzare la funzione ggcorrplot()
per costruire un grafico a partire da essa:
ggcorrplot(cor_matrix,
method = "square",
type = "full",
lab = TRUE,
lab_size = 5,
colors = c("red", "white", "forestgreen"),
title = "Correlation Heatmap",
ggtheme = ggplot2::theme_light())
Questa funzione dispone di diversi parametri che possono essere utilizzati per modificare lo stile del grafico:
method = "square"
rende ogni cella un blocco quadrato;lab = TRUE
sovrappone i valori di correlazione su ciascun blocco;colors
indica la direzione: rosso (negativa), bianco (neutrale), verde (positiva);theme_light()
conferisce al grafico uno stile pulito e minimale.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Awesome!
Completion rate improved to 4
Visualizzazione delle Correlazioni con Heatmap
Scorri per mostrare il menu
Le matrici di correlazione possono risultare difficili da interpretare semplicemente osservando i numeri. Le heatmap offrono un modo visivo per comprendere l'intensità e la direzione delle relazioni tra variabili.
Perché utilizzare una heatmap di correlazione?
Una heatmap di correlazione fornisce un metodo visivo per esaminare le relazioni tra variabili numeriche. Utilizzando i colori per rappresentare l'intensità e la direzione delle correlazioni, diventa molto più semplice identificare associazioni forti o deboli a colpo d'occhio. Questo è particolarmente utile quando si lavora con molte variabili, poiché consente di individuare rapidamente schemi, evidenziare la multicollinearità e guidare ulteriori analisi.
Visualizzazione della matrice di correlazione con una heatmap
Per prima cosa, è necessario creare una matrice di correlazione da visualizzare:
# Select numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")
Successivamente, è possibile utilizzare la funzione ggcorrplot()
per costruire un grafico a partire da essa:
ggcorrplot(cor_matrix,
method = "square",
type = "full",
lab = TRUE,
lab_size = 5,
colors = c("red", "white", "forestgreen"),
title = "Correlation Heatmap",
ggtheme = ggplot2::theme_light())
Questa funzione dispone di diversi parametri che possono essere utilizzati per modificare lo stile del grafico:
method = "square"
rende ogni cella un blocco quadrato;lab = TRUE
sovrappone i valori di correlazione su ciascun blocco;colors
indica la direzione: rosso (negativa), bianco (neutrale), verde (positiva);theme_light()
conferisce al grafico uno stile pulito e minimale.
Grazie per i tuoi commenti!