Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Visualisierung von Matrixdaten | Abschnitt
Practice
Projects
Quizzes & Challenges
Quizze
Challenges
/
Statistische Visualisierung mit Seaborn

bookVisualisierung von Matrixdaten

Ein heatmap ist ein Diagramm, bei dem Datenwerte als Farben in einer Matrix dargestellt werden.

Dies ist die Standardmethode zur Visualisierung von Korrelationsmatrizen (wie Variablen zueinander in Beziehung stehen) oder Zeitreihengittern (z. B. Monate vs. Jahre).

Wichtig: Im Gegensatz zu scatterplot oder barplot, die lange Datenlisten verwenden, benötigt heatmap die Daten typischerweise im Matrix- (2D-) Format. Dies wird häufig durch die Verwendung von df.pivot_table() vor dem Plotten erreicht.

Wichtige Parameter

  • annot=True: schreibt den Datenwert in jede Zelle;
  • cmap: die zu verwendende Farbskala (Gradient). Häufige Optionen: 'viridis', 'coolwarm', 'magma';
  • fmt: String-Formatierungscode zur Steuerung der Zahlenanzeige;
  • 'd': Ganzzahlen (ohne Dezimalstellen);
  • '.2f': Fließkommazahlen mit 2 Dezimalstellen;
  • 'g': allgemeines Format (kompakt);
  • linewidths / linecolor: fügt deutliche Ränder zwischen den Zellen hinzu.

Beispiel

Hier ist eine Heatmap, die die Korrelation zwischen numerischen Variablen im tips-Datensatz zeigt.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
copy
Aufgabe

Swipe to start coding

Visualisierung der Anzahl der Passagiere im Verlauf der Jahre. Die Daten wurden bereits mithilfe von upd_df in eine Matrix (pivot_table) umgeformt.

  1. Stil auf 'ticks' setzen. Die Hintergrundfarbe der Abbildung auf 'seagreen' ('figure.facecolor') ändern.
  2. Heatmap erstellen:
  • upd_df als Daten übergeben (dies ist das erste Argument, daher ist data= nicht erforderlich).
  • Die Farbskala 'viridis' (cmap) verwenden.
  • Zahlen in den Zellen anzeigen (annot=True).
  • Zahlenformatierung mit '0.99g' (allgemeines Format).
  • Die Linienfarbe zwischen den Zellen auf 'plum' (linecolor) setzen.
  1. Diagramm anzeigen.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 16
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

bookVisualisierung von Matrixdaten

Swipe um das Menü anzuzeigen

Ein heatmap ist ein Diagramm, bei dem Datenwerte als Farben in einer Matrix dargestellt werden.

Dies ist die Standardmethode zur Visualisierung von Korrelationsmatrizen (wie Variablen zueinander in Beziehung stehen) oder Zeitreihengittern (z. B. Monate vs. Jahre).

Wichtig: Im Gegensatz zu scatterplot oder barplot, die lange Datenlisten verwenden, benötigt heatmap die Daten typischerweise im Matrix- (2D-) Format. Dies wird häufig durch die Verwendung von df.pivot_table() vor dem Plotten erreicht.

Wichtige Parameter

  • annot=True: schreibt den Datenwert in jede Zelle;
  • cmap: die zu verwendende Farbskala (Gradient). Häufige Optionen: 'viridis', 'coolwarm', 'magma';
  • fmt: String-Formatierungscode zur Steuerung der Zahlenanzeige;
  • 'd': Ganzzahlen (ohne Dezimalstellen);
  • '.2f': Fließkommazahlen mit 2 Dezimalstellen;
  • 'g': allgemeines Format (kompakt);
  • linewidths / linecolor: fügt deutliche Ränder zwischen den Zellen hinzu.

Beispiel

Hier ist eine Heatmap, die die Korrelation zwischen numerischen Variablen im tips-Datensatz zeigt.

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
copy
Aufgabe

Swipe to start coding

Visualisierung der Anzahl der Passagiere im Verlauf der Jahre. Die Daten wurden bereits mithilfe von upd_df in eine Matrix (pivot_table) umgeformt.

  1. Stil auf 'ticks' setzen. Die Hintergrundfarbe der Abbildung auf 'seagreen' ('figure.facecolor') ändern.
  2. Heatmap erstellen:
  • upd_df als Daten übergeben (dies ist das erste Argument, daher ist data= nicht erforderlich).
  • Die Farbskala 'viridis' (cmap) verwenden.
  • Zahlen in den Zellen anzeigen (annot=True).
  • Zahlenformatierung mit '0.99g' (allgemeines Format).
  • Die Linienfarbe zwischen den Zellen auf 'plum' (linecolor) setzen.
  1. Diagramm anzeigen.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 16
single

single

some-alt