Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Heatmap-Diagramm | Visualisierung Mit Seaborn
Ultimative Visualisierung mit Python

bookHeatmap-Diagramm

Note
Definition

Eine Heatmap ist eine Methode zur Visualisierung zweidimensionaler Daten, bei der Farben verwendet werden, um die Ausprägung jedes Wertes darzustellen.

Heatmap-Beispiel

In diesem Beispiel wird eine Heatmap verwendet, um paarweise Korrelationen zwischen Variablen in einem Datensatz darzustellen.

Erstellen einer einfachen Heatmap

seaborn bietet eine Funktion namens heatmap(). Ihr einziges erforderliches Argument ist data, das ein 2D-(rechteckiger) Datensatz sein muss.

Der häufigste Anwendungsfall für eine Heatmap ist die Darstellung einer Korrelationsmatrix, wie im obigen Beispiel. Bei einem DataFrame sollte zunächst die Methode corr() aufgerufen werden, um eine Korrelationsmatrix zu erhalten. Erst dann wird diese Matrix als Argument an die Funktion heatmap() übergeben:

Ein typischer Anwendungsfall für eine Heatmap ist die Visualisierung einer Korrelationsmatrix. Bei einem DataFrame wird zunächst die Methode corr() aufgerufen, um die Korrelationsmatrix zu erhalten, und anschließend diese Matrix als Argument an die Funktion heatmap() übergeben.

123456789101112131415
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd # Loading the dataset with the countries data url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix) plt.show()
copy

Die Korrelationsmatrix wurde ausschließlich mit den numerischen Spalten des DataFrame erstellt. Spalten mit Zeichenketten wurden durch Setzen von numeric_only=True ausgeschlossen.

Annotation und Farben

Diese Heatmap kann durch das Eintragen des entsprechenden Wertes (Korrelationskoeffizient in unserem Fall) in jede Zelle informativer gestaltet werden. Dies kann einfach durch Setzen des Parameters annot auf True erreicht werden.

Note
Hinweis

Es ist ebenfalls möglich, die Farben unserer Heatmap durch Setzen des Parameters cmap zu ändern (weitere Informationen finden Sie im "Auswahl von Farbpaletten"-Artikel).

123456789101112131415
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd # Loading the dataset with the countries data url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Setting annotation and color palette sns.heatmap(correlation_matrix, annot=True, cmap='viridis') plt.show()
copy

Die Farbskala auf der rechten Seite kann durch Setzen von cbar=False entfernt werden.

Note
Weiterführende Informationen

In den meisten Fällen sind dies alle notwendigen Heatmap-Anpassungen. Weitere Optionen finden Sie in der heatmap()-Dokumentation.

Lesbarkeit verbessern

Ein letzter Schritt zur Verbesserung der Lesbarkeit der Heatmap ist das Drehen der Achsenbeschriftungen mit den bereits bekannten Funktionen xticks() und yticks():

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd # Loading the dataset with the countries data url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix, annot=True, cmap='viridis') # Rotating the ticks by 20 degrees counterclockwise plt.xticks(rotation=20) plt.yticks(rotation=20) plt.show()
copy
Aufgabe

Swipe to start coding

  1. Die korrekte Methode zur Erstellung einer Korrelationsmatrix verwenden.
  2. Das Argument der Methode so setzen, dass nur numerische Variablen einbezogen werden.
  3. Die richtige Funktion zur Erstellung einer Heatmap verwenden.
  4. correlation_matrix als Daten für die Heatmap durch Angabe des ersten Arguments festlegen.
  5. Die Werte in jeder Zelle der Matrix durch Angabe des zweiten Arguments hinzufügen.
  6. Die Farbpalette (colormap) der Heatmap durch Angabe des dritten (rechten) Arguments auf 'crest' setzen.
  7. Die x- und y-Achsenbeschriftungen durch Angabe eines Schlüsselwortarguments in xticks() und yticks() um 15 Grad gegen den Uhrzeigersinn drehen.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 7
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

Awesome!

Completion rate improved to 3.85

bookHeatmap-Diagramm

Swipe um das Menü anzuzeigen

Note
Definition

Eine Heatmap ist eine Methode zur Visualisierung zweidimensionaler Daten, bei der Farben verwendet werden, um die Ausprägung jedes Wertes darzustellen.

Heatmap-Beispiel

In diesem Beispiel wird eine Heatmap verwendet, um paarweise Korrelationen zwischen Variablen in einem Datensatz darzustellen.

Erstellen einer einfachen Heatmap

seaborn bietet eine Funktion namens heatmap(). Ihr einziges erforderliches Argument ist data, das ein 2D-(rechteckiger) Datensatz sein muss.

Der häufigste Anwendungsfall für eine Heatmap ist die Darstellung einer Korrelationsmatrix, wie im obigen Beispiel. Bei einem DataFrame sollte zunächst die Methode corr() aufgerufen werden, um eine Korrelationsmatrix zu erhalten. Erst dann wird diese Matrix als Argument an die Funktion heatmap() übergeben:

Ein typischer Anwendungsfall für eine Heatmap ist die Visualisierung einer Korrelationsmatrix. Bei einem DataFrame wird zunächst die Methode corr() aufgerufen, um die Korrelationsmatrix zu erhalten, und anschließend diese Matrix als Argument an die Funktion heatmap() übergeben.

123456789101112131415
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd # Loading the dataset with the countries data url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix) plt.show()
copy

Die Korrelationsmatrix wurde ausschließlich mit den numerischen Spalten des DataFrame erstellt. Spalten mit Zeichenketten wurden durch Setzen von numeric_only=True ausgeschlossen.

Annotation und Farben

Diese Heatmap kann durch das Eintragen des entsprechenden Wertes (Korrelationskoeffizient in unserem Fall) in jede Zelle informativer gestaltet werden. Dies kann einfach durch Setzen des Parameters annot auf True erreicht werden.

Note
Hinweis

Es ist ebenfalls möglich, die Farben unserer Heatmap durch Setzen des Parameters cmap zu ändern (weitere Informationen finden Sie im "Auswahl von Farbpaletten"-Artikel).

123456789101112131415
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd # Loading the dataset with the countries data url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Setting annotation and color palette sns.heatmap(correlation_matrix, annot=True, cmap='viridis') plt.show()
copy

Die Farbskala auf der rechten Seite kann durch Setzen von cbar=False entfernt werden.

Note
Weiterführende Informationen

In den meisten Fällen sind dies alle notwendigen Heatmap-Anpassungen. Weitere Optionen finden Sie in der heatmap()-Dokumentation.

Lesbarkeit verbessern

Ein letzter Schritt zur Verbesserung der Lesbarkeit der Heatmap ist das Drehen der Achsenbeschriftungen mit den bereits bekannten Funktionen xticks() und yticks():

12345678910111213141516171819
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd # Loading the dataset with the countries data url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix, annot=True, cmap='viridis') # Rotating the ticks by 20 degrees counterclockwise plt.xticks(rotation=20) plt.yticks(rotation=20) plt.show()
copy
Aufgabe

Swipe to start coding

  1. Die korrekte Methode zur Erstellung einer Korrelationsmatrix verwenden.
  2. Das Argument der Methode so setzen, dass nur numerische Variablen einbezogen werden.
  3. Die richtige Funktion zur Erstellung einer Heatmap verwenden.
  4. correlation_matrix als Daten für die Heatmap durch Angabe des ersten Arguments festlegen.
  5. Die Werte in jeder Zelle der Matrix durch Angabe des zweiten Arguments hinzufügen.
  6. Die Farbpalette (colormap) der Heatmap durch Angabe des dritten (rechten) Arguments auf 'crest' setzen.
  7. Die x- und y-Achsenbeschriftungen durch Angabe eines Schlüsselwortarguments in xticks() und yticks() um 15 Grad gegen den Uhrzeigersinn drehen.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 7
single

single

some-alt