Countplot
Un countplot è un grafico che crea colonne (barre) che rappresentano il numero di voci per ciascuna categoria di un elenco categoriale. Può essere considerato anche come un istogramma di una variabile categoriale.
Qui ogni colonna rappresenta il numero di passeggeri del Titanic per ciascuna classe. Potresti aver già notato che questo grafico è molto simile al bar chart. In effetti, si tratta di una tipologia specifica di bar chart che rappresenta la frequenza di ciascuna categoria.
Nota
È comunque necessario importare il modulo
pyplot
damatplotlib
e utilizzare la funzioneplt.show()
per visualizzare i grafici creati conseaborn
.
Per creare un countplot con seaborn
, si deve utilizzare la funzione countplot()
. Esistono diverse opzioni per passare i dati a questa funzione.
Passaggio di un array 1D
La prima opzione è semplicemente passare il valore per il parametro x
, che può essere una qualche forma di array:
import seaborn as sns import matplotlib.pyplot as plt fruits = ['apple', 'banana', 'orange', 'apple', 'apple', 'apple', 'orange', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana'] sns.countplot(x=fruits) plt.show()
La funzione conta ogni elemento unico nella lista e crea una colonna con l'altezza corrispondente.
Il parametro y
può essere utilizzato al posto di x
per cambiare l'orientamento del grafico da verticale a orizzontale.
Passaggio di un Oggetto 2D
Un'altra opzione consiste nell'utilizzare il parametro data
combinato con il parametro x
o y
. Questo approccio è adatto per lavorare con un pandas
di DataFrame
. È possibile passare un elenco di array oppure un DataFrame
come valore per data
. Per x
o y
si può fornire il nome della colonna nel DataFrame
.
import seaborn as sns import matplotlib.pyplot as plt # Loading a built-in dataset of the Titanic passengers titanic_df = sns.load_dataset('titanic') sns.countplot(data=titanic_df, x='class') plt.show()
In questo esempio, la funzione crea un countplot utilizzando la colonna 'class'
del DataFrame
Titanic, mostrando quante occorrenze esistono per ciascun valore unico in quella colonna.
Swipe to start coding
- Importare la libreria
seaborn
con l'aliassns
. - Importare il modulo
matplotlib.pyplot
con l'aliasplt
. - Utilizzare la funzione corretta per creare un countplot.
- Utilizzare
diamonds
come primo argomento per specificare ilDataFrame
. - Utilizzare la colonna
'cut'
del DataFramediamonds
come categorie per il countplot e visualizzare le categorie sull'asse y tramite il secondo argomento. - Visualizzare il grafico utilizzando la funzione corretta.
Soluzione
Grazie per i tuoi commenti!