Countplot
En countplot er et diagram, der opretter søjler (barer), som repræsenterer antallet af poster for hver kategori i en kategorisk liste. Det kan også betragtes som et histogram for en kategorisk variabel.
Her repræsenterer hver søjle antallet af Titanic-passagerer i hver klasse. Du har måske allerede bemærket, at dette diagram minder meget om et søjlediagram. Faktisk er det en ret specifik type søjlediagram, der viser frekvensen af hver kategori.
Note
Du skal stadig importere
pyplot
-modulet framatplotlib
og bruge funktionenplt.show()
for at vise de diagrammer, der er oprettet medseaborn
.
For at oprette en countplot med seaborn
skal du bruge funktionen countplot()
. Der er flere mulige måder at videregive vores data til denne funktion på.
Overførsel af et 1D-array
Den første mulighed er blot at angive værdien for x
-parameteren, som kan være en form for array:
import seaborn as sns import matplotlib.pyplot as plt fruits = ['apple', 'banana', 'orange', 'apple', 'apple', 'apple', 'orange', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana'] sns.countplot(x=fruits) plt.show()
Funktionen tæller hvert unikke element i listen og opretter en søjle med den tilsvarende højde.
Parameteren y
kan bruges i stedet for x
for at ændre plottets orientering fra lodret til vandret.
Overførsel af et 2D-objekt
En anden mulighed er at bruge parameteren data
kombineret med parameteren x
eller y
. Denne tilgang er velegnet til arbejde med pandas
DataFrame
. Du kan angive en liste af arrays eller en DataFrame
som værdien for data
. For x
eller y
kan du angive navnet på kolonnen i DataFrame
.
import seaborn as sns import matplotlib.pyplot as plt # Loading a built-in dataset of the Titanic passengers titanic_df = sns.load_dataset('titanic') sns.countplot(data=titanic_df, x='class') plt.show()
I dette eksempel opretter funktionen et countplot ved hjælp af kolonnen 'class'
fra Titanic-DataFrame
, hvilket viser hvor mange poster der findes for hver unik værdi i denne kolonne.
Swipe to start coding
- Importér
seaborn
-biblioteket med aliasetsns
. - Importér modulet
matplotlib.pyplot
med aliasetplt
. - Brug den korrekte funktion til at oprette et countplot.
- Brug
diamonds
som det første argument for at angiveDataFrame
. - Brug kolonnen
'cut'
fradiamonds
DataFrame som kategorierne for countplottet og vis kategorierne på y-aksen via det andet argument. - Vis plottet ved hjælp af den korrekte funktion.
Løsning
Tak for dine kommentarer!