Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Visualizzazione dei Dati Matriciali | Sezione
Visualizzazione Statistica con Seaborn

bookVisualizzazione dei Dati Matriciali

Una heatmap è un grafico in cui i valori dei dati sono rappresentati come colori in una matrice.

Questo è il metodo standard per visualizzare matrici di correlazione (come le variabili sono correlate tra loro) o griglie di serie temporali (ad esempio, mesi vs. anni).

Importante: a differenza di scatterplot o barplot, che utilizzano lunghe liste di dati, heatmap richiede tipicamente che i dati siano in formato matrice (2D). Questo si ottiene spesso utilizzando df.pivot_table() prima della visualizzazione.

Parametri principali

  • annot=True: scrive il valore dei dati in ogni cella;
  • cmap: la mappa di colori (gradiente) da utilizzare. Scelte comuni: 'viridis', 'coolwarm', 'magma';
  • fmt: codice di formattazione delle stringhe per controllare l'aspetto dei numeri;
  • 'd': interi (senza decimali);
  • '.2f': numeri decimali con 2 cifre decimali;
  • 'g': formato generale (compatto);
  • linewidths / linecolor: aggiunge bordi distinti tra le celle.

Esempio

Qui è mostrata una heatmap che rappresenta la correlazione tra variabili numeriche nel dataset tips.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
copy
Compito

Swipe to start coding

Visualizzazione del numero di passeggeri che volano nel corso degli anni. I dati sono già stati riorganizzati in una matrice (upd_df) per te utilizzando pivot_table.

  1. Impostare lo stile su 'ticks'. Modificare il colore di sfondo della figura in 'seagreen' ('figure.facecolor').
  2. Creare una heatmap:
  • Utilizzare upd_df come dati (è il primo argomento, quindi non è necessario data=).
  • Usare la mappa colori 'viridis' (cmap).
  • Visualizzare i numeri nelle celle (annot=True).
  • Formattare i numeri utilizzando '0.99g' (formato generale).
  • Impostare il colore delle linee tra le celle su 'plum' (linecolor).
  1. Visualizzare il grafico.

Soluzione

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 16
single

single

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

close

bookVisualizzazione dei Dati Matriciali

Scorri per mostrare il menu

Una heatmap è un grafico in cui i valori dei dati sono rappresentati come colori in una matrice.

Questo è il metodo standard per visualizzare matrici di correlazione (come le variabili sono correlate tra loro) o griglie di serie temporali (ad esempio, mesi vs. anni).

Importante: a differenza di scatterplot o barplot, che utilizzano lunghe liste di dati, heatmap richiede tipicamente che i dati siano in formato matrice (2D). Questo si ottiene spesso utilizzando df.pivot_table() prima della visualizzazione.

Parametri principali

  • annot=True: scrive il valore dei dati in ogni cella;
  • cmap: la mappa di colori (gradiente) da utilizzare. Scelte comuni: 'viridis', 'coolwarm', 'magma';
  • fmt: codice di formattazione delle stringhe per controllare l'aspetto dei numeri;
  • 'd': interi (senza decimali);
  • '.2f': numeri decimali con 2 cifre decimali;
  • 'g': formato generale (compatto);
  • linewidths / linecolor: aggiunge bordi distinti tra le celle.

Esempio

Qui è mostrata una heatmap che rappresenta la correlazione tra variabili numeriche nel dataset tips.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
copy
Compito

Swipe to start coding

Visualizzazione del numero di passeggeri che volano nel corso degli anni. I dati sono già stati riorganizzati in una matrice (upd_df) per te utilizzando pivot_table.

  1. Impostare lo stile su 'ticks'. Modificare il colore di sfondo della figura in 'seagreen' ('figure.facecolor').
  2. Creare una heatmap:
  • Utilizzare upd_df come dati (è il primo argomento, quindi non è necessario data=).
  • Usare la mappa colori 'viridis' (cmap).
  • Visualizzare i numeri nelle celle (annot=True).
  • Formattare i numeri utilizzando '0.99g' (formato generale).
  • Impostare il colore delle linee tra le celle su 'plum' (linecolor).
  1. Visualizzare il grafico.

Soluzione

Switch to desktopCambia al desktop per esercitarti nel mondo realeContinua da dove ti trovi utilizzando una delle opzioni seguenti
Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 16
single

single

some-alt