Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Visualisering af Matrixdata | Sektion
Statistisk Visualisering med Seaborn

bookVisualisering af Matrixdata

Et heatmap er et plot, hvor dataværdier repræsenteres som farver i en matrix.

Dette er den standardmetode, der bruges til at visualisere korrelationsmatricer (hvordan variable relaterer til hinanden) eller tidsseriegitre (f.eks. måneder vs. år).

Vigtigt: I modsætning til scatterplot eller barplot, som tager lange lister af data, kræver heatmap typisk, at dine data er i matrix (2D) format. Dette opnås ofte ved at bruge df.pivot_table() før plotning.

Nøgleparametre

  • annot=True: skriver dataværdien i hver celle;
  • cmap: farvekortet (gradient), der skal bruges. Almindelige valg: 'viridis', 'coolwarm', 'magma';
  • fmt: strengformateringskode til at styre, hvordan tal vises;
  • 'd': heltal (ingen decimaler);
  • '.2f': flydende tal med 2 decimaler;
  • 'g': generelt format (kompakt);
  • linewidths / linecolor: tilføjer tydelige grænser mellem celler.

Eksempel

Her er et heatmap, der viser korrelationen mellem numeriske variable i tips datasættet.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
copy
Opgave

Swipe to start coding

Visualisering af antallet af passagerer, der flyver gennem årene. Dataene er allerede omformet til en matrix (upd_df) for dig ved hjælp af pivot_table.

  1. Indstil stilen til 'ticks'. Skift figurens baggrundsfarve til 'seagreen' ('figure.facecolor').
  2. Opret et heatmap:
  • Brug upd_df som data (dette er det første argument, så du behøver ikke data=).
  • Anvend farvekortet 'viridis' (cmap).
  • Vis tallene i cellerne (annot=True).
  • Formater tallene med '0.99g' (generelt format).
  • Indstil farven på linjerne mellem cellerne til 'plum' (linecolor).
  1. Vis plottet.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 16
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

bookVisualisering af Matrixdata

Stryg for at vise menuen

Et heatmap er et plot, hvor dataværdier repræsenteres som farver i en matrix.

Dette er den standardmetode, der bruges til at visualisere korrelationsmatricer (hvordan variable relaterer til hinanden) eller tidsseriegitre (f.eks. måneder vs. år).

Vigtigt: I modsætning til scatterplot eller barplot, som tager lange lister af data, kræver heatmap typisk, at dine data er i matrix (2D) format. Dette opnås ofte ved at bruge df.pivot_table() før plotning.

Nøgleparametre

  • annot=True: skriver dataværdien i hver celle;
  • cmap: farvekortet (gradient), der skal bruges. Almindelige valg: 'viridis', 'coolwarm', 'magma';
  • fmt: strengformateringskode til at styre, hvordan tal vises;
  • 'd': heltal (ingen decimaler);
  • '.2f': flydende tal med 2 decimaler;
  • 'g': generelt format (kompakt);
  • linewidths / linecolor: tilføjer tydelige grænser mellem celler.

Eksempel

Her er et heatmap, der viser korrelationen mellem numeriske variable i tips datasættet.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
copy
Opgave

Swipe to start coding

Visualisering af antallet af passagerer, der flyver gennem årene. Dataene er allerede omformet til en matrix (upd_df) for dig ved hjælp af pivot_table.

  1. Indstil stilen til 'ticks'. Skift figurens baggrundsfarve til 'seagreen' ('figure.facecolor').
  2. Opret et heatmap:
  • Brug upd_df som data (dette er det første argument, så du behøver ikke data=).
  • Anvend farvekortet 'viridis' (cmap).
  • Vis tallene i cellerne (annot=True).
  • Formater tallene med '0.99g' (generelt format).
  • Indstil farven på linjerne mellem cellerne til 'plum' (linecolor).
  1. Vis plottet.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 16
single

single

some-alt