Countplot
Een countplot is een grafiek die kolommen (balken) maakt die het aantal vermeldingen voor elke categorie van een categorische lijst weergeven. Het kan ook worden beschouwd als een histogram van een categorische variabele.
Hier vertegenwoordigt elke kolom het aantal Titanic-passagiers van elke klasse. Het valt wellicht al op dat deze grafiek sterk lijkt op het staafdiagram. Inderdaad, het is een vrij specifiek type staafdiagram dat de frequentie van elke categorie weergeeft.
Opmerking
Je moet nog steeds de module
pyplot
vanmatplotlib
importeren en de functieplt.show()
gebruiken om de grafieken die metseaborn
zijn gemaakt weer te geven.
Om een countplot met seaborn
te maken, gebruik je de functie countplot()
. Er zijn verschillende opties om onze gegevens aan deze functie door te geven.
Een 1D-array doorgeven
De eerste optie is om eenvoudigweg de waarde voor de parameter x
door te geven, wat een soort array kan zijn:
import seaborn as sns import matplotlib.pyplot as plt fruits = ['apple', 'banana', 'orange', 'apple', 'apple', 'apple', 'orange', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana'] sns.countplot(x=fruits) plt.show()
De functie telt elk uniek element in de lijst en maakt een kolom met de bijbehorende hoogte.
De parameter y
kan worden gebruikt in plaats van x
om de oriëntatie van de plot van verticaal naar horizontaal te wijzigen.
Een 2D-object doorgeven
Een andere optie is het gebruik van de parameter data
in combinatie met de parameter x
of y
. Deze aanpak is geschikt voor het werken met een pandas
DataFrame
. U kunt een lijst van arrays of een DataFrame
als waarde voor data
doorgeven. Voor x
of y
kunt u een kolomnaam uit het DataFrame
opgeven.
import seaborn as sns import matplotlib.pyplot as plt # Loading a built-in dataset of the Titanic passengers titanic_df = sns.load_dataset('titanic') sns.countplot(data=titanic_df, x='class') plt.show()
In dit voorbeeld maakt de functie een countplot met behulp van de kolom 'class'
uit het Titanic-DataFrame
, waarbij wordt weergegeven hoeveel vermeldingen er zijn voor elke unieke waarde in die kolom.
Swipe to start coding
- Importeer de
seaborn
-bibliotheek met het aliassns
. - Importeer de module
matplotlib.pyplot
met het aliasplt
. - Gebruik de juiste functie om een countplot te maken.
- Gebruik
diamonds
als het eerste argument om deDataFrame
te specificeren. - Gebruik de kolom
'cut'
van dediamonds
DataFrame als categorieën voor de countplot en toon de categorieën op de y-as via het tweede argument. - Toon de plot met de juiste functie.
Oplossing
Bedankt voor je feedback!