Kursinhalt
Ultimative Visualisierung mit Python
Ultimative Visualisierung mit Python
Heatmap
Ein Heatmap ist eine Methode zur Visualisierung von zweidimensionalen Daten, bei der Farben verwendet werden, um die Größe jedes Wertes darzustellen. Hier ist ein Beispiel für ein Heatmap:
In diesem Beispiel haben wir ein Heatmap verwendet, um die paarweise Korrelation zwischen den Variablen in einem Datensatz darzustellen. Mit einem solchen Heatmap ist alles ordentlich und klar, genau das, was wir von einer guten Visualisierung erwarten.
Erstellen eines einfachen Heatmaps
seaborn
hat eine Funktion namens heatmap()
. Ihr einziger erforderlicher Parameter ist data
, das ein 2D (rechteckiger) Datensatz sein sollte.
Vielleicht der häufigste Anwendungsfall eines Heatmaps ist mit einer Korrelationsmatrix, wie im obigen Beispiel. Gegeben ein DataFrame
, sollten wir zuerst seine corr()
-Methode aufrufen, um eine Korrelationsmatrix zu erhalten, und erst dann diese Matrix als Argument für die heatmap()
-Funktion übergeben:
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix) plt.show()
Alles ist hier ziemlich einfach, jedoch haben wir nicht alle Spalten des DataFrame
verwendet, um eine Korrelationsmatrix zu erstellen (numeric_only=True
), da sie Zeichenfolgen enthalten und nicht numerisch sind.
Annotation und Farben
Dieses Heatmap kann informativer gestaltet werden, indem der entsprechende Wert (Korrelationskoeffizient in unserem Fall) in jede Zelle geschrieben wird. Das kann einfach durch Setzen des annot
Parameters auf True
erreicht werden.
Es ist auch möglich, die Farben für unsere Heatmap zu ändern, indem der cmap
Parameter gesetzt wird (Sie können die Paletten hier erkunden).
Mit diesem Wissen, lassen Sie uns nun unser Beispiel modifizieren:
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Setting annotation and color palette sns.heatmap(correlation_matrix, annot=True, cmap='viridis') plt.show()
Wir könnten auch die Farbskala auf der rechten Seite entfernen, indem wir cbar=False
setzen.
In den meisten Fällen ist das alles, was Sie von einer Heatmap-Anpassung benötigen, jedoch können Sie immer mehr in der Dokumentation erkunden.
Verbesserung der Lesbarkeit
Das Letzte, was die Lesbarkeit unseres Heatmaps verbessern würde, ist das Drehen der Ticks mit den bereits bekannten Funktionen xticks()
und yticks()
:
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix, annot=True, cmap='viridis') # Rotating the ticks by 20 degrees counterclockwise plt.xticks(rotation=20) plt.yticks(rotation=20) plt.show()
Swipe to start coding
- Verwenden Sie die richtige Methode, um eine Korrelationsmatrix zu erstellen.
- Setzen Sie das Argument der Methode, um nur numerische Variablen einzuschließen.
- Verwenden Sie die richtige Funktion, um ein Heatmap zu erstellen.
- Setzen Sie
correlation_matrix
als Daten für das Heatmap, indem Sie das erste Argument angeben. - Fügen Sie die Werte in jeder Zelle der Matrix hinzu, indem Sie das zweite Argument angeben.
- Setzen Sie die Palette (Farbkarte) des Heatmaps auf
'crest'
, indem Sie das dritte (rechtsstehende) Argument angeben. - Drehen Sie die Ticks der x- und y-Achse um 15 Grad gegen den Uhrzeigersinn, indem Sie ein Schlüsselwortargument in
xticks()
undyticks()
angeben.
Lösung
Danke für Ihr Feedback!
Heatmap
Ein Heatmap ist eine Methode zur Visualisierung von zweidimensionalen Daten, bei der Farben verwendet werden, um die Größe jedes Wertes darzustellen. Hier ist ein Beispiel für ein Heatmap:
In diesem Beispiel haben wir ein Heatmap verwendet, um die paarweise Korrelation zwischen den Variablen in einem Datensatz darzustellen. Mit einem solchen Heatmap ist alles ordentlich und klar, genau das, was wir von einer guten Visualisierung erwarten.
Erstellen eines einfachen Heatmaps
seaborn
hat eine Funktion namens heatmap()
. Ihr einziger erforderlicher Parameter ist data
, das ein 2D (rechteckiger) Datensatz sein sollte.
Vielleicht der häufigste Anwendungsfall eines Heatmaps ist mit einer Korrelationsmatrix, wie im obigen Beispiel. Gegeben ein DataFrame
, sollten wir zuerst seine corr()
-Methode aufrufen, um eine Korrelationsmatrix zu erhalten, und erst dann diese Matrix als Argument für die heatmap()
-Funktion übergeben:
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix) plt.show()
Alles ist hier ziemlich einfach, jedoch haben wir nicht alle Spalten des DataFrame
verwendet, um eine Korrelationsmatrix zu erstellen (numeric_only=True
), da sie Zeichenfolgen enthalten und nicht numerisch sind.
Annotation und Farben
Dieses Heatmap kann informativer gestaltet werden, indem der entsprechende Wert (Korrelationskoeffizient in unserem Fall) in jede Zelle geschrieben wird. Das kann einfach durch Setzen des annot
Parameters auf True
erreicht werden.
Es ist auch möglich, die Farben für unsere Heatmap zu ändern, indem der cmap
Parameter gesetzt wird (Sie können die Paletten hier erkunden).
Mit diesem Wissen, lassen Sie uns nun unser Beispiel modifizieren:
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Setting annotation and color palette sns.heatmap(correlation_matrix, annot=True, cmap='viridis') plt.show()
Wir könnten auch die Farbskala auf der rechten Seite entfernen, indem wir cbar=False
setzen.
In den meisten Fällen ist das alles, was Sie von einer Heatmap-Anpassung benötigen, jedoch können Sie immer mehr in der Dokumentation erkunden.
Verbesserung der Lesbarkeit
Das Letzte, was die Lesbarkeit unseres Heatmaps verbessern würde, ist das Drehen der Ticks mit den bereits bekannten Funktionen xticks()
und yticks()
:
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd url = 'https://content-media-cdn.codefinity.com/courses/47339f29-4722-4e72-a0d4-6112c70ff738/countries_data.csv' # Loading the dataset with the countries data countries_df = pd.read_csv(url, index_col=0) # Creating a correlation matrix with all numeric variables correlation_matrix = countries_df.corr(numeric_only=True) # Creating a heatmap based on the correlation matrix sns.heatmap(correlation_matrix, annot=True, cmap='viridis') # Rotating the ticks by 20 degrees counterclockwise plt.xticks(rotation=20) plt.yticks(rotation=20) plt.show()
Swipe to start coding
- Verwenden Sie die richtige Methode, um eine Korrelationsmatrix zu erstellen.
- Setzen Sie das Argument der Methode, um nur numerische Variablen einzuschließen.
- Verwenden Sie die richtige Funktion, um ein Heatmap zu erstellen.
- Setzen Sie
correlation_matrix
als Daten für das Heatmap, indem Sie das erste Argument angeben. - Fügen Sie die Werte in jeder Zelle der Matrix hinzu, indem Sie das zweite Argument angeben.
- Setzen Sie die Palette (Farbkarte) des Heatmaps auf
'crest'
, indem Sie das dritte (rechtsstehende) Argument angeben. - Drehen Sie die Ticks der x- und y-Achse um 15 Grad gegen den Uhrzeigersinn, indem Sie ein Schlüsselwortargument in
xticks()
undyticks()
angeben.
Lösung
Danke für Ihr Feedback!