Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Visualisering av Matrisdata | Sektion
Statistisk Visualisering med Seaborn

bookVisualisering av Matrisdata

Ett heatmap är ett diagram där datavärden representeras som färger i en matris.

Detta är det standardiserade sättet att visualisera korrelationsmatriser (hur variabler relaterar till varandra) eller tidsserier i rutnät (t.ex. månader vs. år).

Viktigt: till skillnad från scatterplot eller barplot som tar långa listor av data, kräver heatmap vanligtvis att dina data är i matrisformat (2D). Detta uppnås ofta med df.pivot_table() innan visualisering.

Viktiga parametrar

  • annot=True: skriver ut datavärdet i varje cell;
  • cmap: färgskalan (gradient) som används. Vanliga val: 'viridis', 'coolwarm', 'magma';
  • fmt: strängformatkod för att styra hur siffror visas;
  • 'd': heltal (utan decimaler);
  • '.2f': flyttal med 2 decimaler;
  • 'g': allmänt format (kompakt);
  • linewidths / linecolor: lägger till tydliga gränser mellan celler.

Exempel

Här visas ett heatmap som illustrerar korrelationen mellan numeriska variabler i tips-datasetet.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
copy
Uppgift

Swipe to start coding

Visualisera antalet passagerare som flyger över åren. Datan har redan omformats till en matris (upd_df) åt dig med hjälp av pivot_table.

  1. Ställ in stilen på 'ticks'. Ändra figurens bakgrundsfärg till 'seagreen' ('figure.facecolor').
  2. Skapa en värmekarta:
  • Använd upd_df som data (detta är det första argumentet, så du behöver inte använda data=).
  • Använd färgkartan 'viridis' (cmap).
  • Visa siffrorna i cellerna (annot=True).
  • Formatera siffrorna med '0.99g' (allmänt format).
  • Ange färgen på linjerna mellan cellerna till 'plum' (linecolor).
  1. Visa diagrammet.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 16
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

close

bookVisualisering av Matrisdata

Svep för att visa menyn

Ett heatmap är ett diagram där datavärden representeras som färger i en matris.

Detta är det standardiserade sättet att visualisera korrelationsmatriser (hur variabler relaterar till varandra) eller tidsserier i rutnät (t.ex. månader vs. år).

Viktigt: till skillnad från scatterplot eller barplot som tar långa listor av data, kräver heatmap vanligtvis att dina data är i matrisformat (2D). Detta uppnås ofta med df.pivot_table() innan visualisering.

Viktiga parametrar

  • annot=True: skriver ut datavärdet i varje cell;
  • cmap: färgskalan (gradient) som används. Vanliga val: 'viridis', 'coolwarm', 'magma';
  • fmt: strängformatkod för att styra hur siffror visas;
  • 'd': heltal (utan decimaler);
  • '.2f': flyttal med 2 decimaler;
  • 'g': allmänt format (kompakt);
  • linewidths / linecolor: lägger till tydliga gränser mellan celler.

Exempel

Här visas ett heatmap som illustrerar korrelationen mellan numeriska variabler i tips-datasetet.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
copy
Uppgift

Swipe to start coding

Visualisera antalet passagerare som flyger över åren. Datan har redan omformats till en matris (upd_df) åt dig med hjälp av pivot_table.

  1. Ställ in stilen på 'ticks'. Ändra figurens bakgrundsfärg till 'seagreen' ('figure.facecolor').
  2. Skapa en värmekarta:
  • Använd upd_df som data (detta är det första argumentet, så du behöver inte använda data=).
  • Använd färgkartan 'viridis' (cmap).
  • Visa siffrorna i cellerna (annot=True).
  • Formatera siffrorna med '0.99g' (allmänt format).
  • Ange färgen på linjerna mellan cellerna till 'plum' (linecolor).
  1. Visa diagrammet.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 16
single

single

some-alt