Matrixgegevens Visualiseren
Een heatmap is een grafiek waarbij gegevenswaarden worden weergegeven als kleuren in een matrix.
Dit is de standaardmethode om correlatiematrices (hoe variabelen zich tot elkaar verhouden) of tijdreeksrasters (bijv. maanden versus jaren) te visualiseren.
Belangrijk: in tegenstelling tot scatterplot of barplot, die lange lijsten met gegevens gebruiken, vereist heatmap doorgaans dat uw gegevens in een matrix (2D)-formaat staan. Dit wordt vaak bereikt met df.pivot_table() voordat u de visualisatie maakt.
Belangrijkste parameters
annot=True: toont de gegevenswaarde in elke cel;cmap: het kleurenschema (gradiënt) dat wordt gebruikt. Veelgebruikte opties:'viridis','coolwarm','magma';fmt: tekenreeks voor getalnotatie om te bepalen hoe getallen worden weergegeven;'d': gehele getallen (geen decimalen);'.2f': kommagetallen met 2 decimalen;'g': algemeen formaat (compact);linewidths/linecolor: voegt duidelijke randen toe tussen cellen.
Voorbeeld
Hier is een heatmap die de correlatie tussen numerieke variabelen in de tips dataset toont.
12345678910111213141516171819import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
Swipe to start coding
Visualiseer het aantal passagiers dat in de loop der jaren vliegt. De gegevens zijn al omgevormd tot een matrix (upd_df) met behulp van pivot_table.
- Stel de stijl in op
'ticks'. Wijzig de achtergrondkleur van de figuur naar'seagreen'('figure.facecolor'). - Maak een heatmap:
- Gebruik
upd_dfals data (dit is het eerste argument, dusdata=is niet nodig). - Gebruik de kleurenschaal
'viridis'(cmap). - Toon de getallen in de cellen (
annot=True). - Formatteer de getallen met
'0.99g'(algemeen formaat). - Stel de kleur van de lijnen tussen de cellen in op
'plum'(linecolor).
- Toon de visualisatie.
Oplossing
Bedankt voor je feedback!
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Geweldig!
Completion tarief verbeterd naar 4.55
Matrixgegevens Visualiseren
Veeg om het menu te tonen
Een heatmap is een grafiek waarbij gegevenswaarden worden weergegeven als kleuren in een matrix.
Dit is de standaardmethode om correlatiematrices (hoe variabelen zich tot elkaar verhouden) of tijdreeksrasters (bijv. maanden versus jaren) te visualiseren.
Belangrijk: in tegenstelling tot scatterplot of barplot, die lange lijsten met gegevens gebruiken, vereist heatmap doorgaans dat uw gegevens in een matrix (2D)-formaat staan. Dit wordt vaak bereikt met df.pivot_table() voordat u de visualisatie maakt.
Belangrijkste parameters
annot=True: toont de gegevenswaarde in elke cel;cmap: het kleurenschema (gradiënt) dat wordt gebruikt. Veelgebruikte opties:'viridis','coolwarm','magma';fmt: tekenreeks voor getalnotatie om te bepalen hoe getallen worden weergegeven;'d': gehele getallen (geen decimalen);'.2f': kommagetallen met 2 decimalen;'g': algemeen formaat (compact);linewidths/linecolor: voegt duidelijke randen toe tussen cellen.
Voorbeeld
Hier is een heatmap die de correlatie tussen numerieke variabelen in de tips dataset toont.
12345678910111213141516171819import seaborn as sns import matplotlib.pyplot as plt # Load dataset df = sns.load_dataset('tips') # 1. Calculate Correlation Matrix (creates the grid) corr_matrix = df.corr(numeric_only=True) # 2. Plot Heatmap sns.heatmap( data=corr_matrix, annot=True, # Show numbers fmt='.2f', # 2 decimal places cmap='coolwarm',# Red-Blue gradient linewidths=1 # Separation lines ) plt.show()
Swipe to start coding
Visualiseer het aantal passagiers dat in de loop der jaren vliegt. De gegevens zijn al omgevormd tot een matrix (upd_df) met behulp van pivot_table.
- Stel de stijl in op
'ticks'. Wijzig de achtergrondkleur van de figuur naar'seagreen'('figure.facecolor'). - Maak een heatmap:
- Gebruik
upd_dfals data (dit is het eerste argument, dusdata=is niet nodig). - Gebruik de kleurenschaal
'viridis'(cmap). - Toon de getallen in de cellen (
annot=True). - Formatteer de getallen met
'0.99g'(algemeen formaat). - Stel de kleur van de lijnen tussen de cellen in op
'plum'(linecolor).
- Toon de visualisatie.
Oplossing
Bedankt voor je feedback!
single