Countplot
Countplot — це графік, який створює стовпці (стовпчики), що відображають кількість записів для кожної категорії у категоріальному списку. Його також можна розглядати як гістограму для категоріальної змінної.
Тут кожен стовпчик відображає кількість пасажирів Титаніка кожного класу. Ви могли вже помітити, що цей графік дуже схожий на стовпчикову діаграму. Дійсно, це досить специфічний вид стовпчикової діаграми, що відображає частоту кожної категорії.
Note
Вам все одно потрібно імпортувати модуль
pyplot
зmatplotlib
і використовувати функціюplt.show()
, щоб відобразити графіки, створені за допомогоюseaborn
.
Щоб створити countplot у seaborn
, слід використовувати функцію countplot()
. Існує кілька можливих способів передати наші дані цій функції.
Передача одномірного масиву
Перший варіант — просто передати значення для параметра x
, яким може бути певний масив:
import seaborn as sns import matplotlib.pyplot as plt fruits = ['apple', 'banana', 'orange', 'apple', 'apple', 'apple', 'orange', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana', 'banana'] sns.countplot(x=fruits) plt.show()
Функція підраховує кожен унікальний елемент у списку та створює стовпець відповідної висоти.
Параметр y
можна використовувати замість x
, щоб змінити орієнтацію графіка з вертикальної на горизонтальну.
Передача двовимірного об'єкта
Ще одним варіантом є використання параметра data
у поєднанні з параметром x
або y
. Такий підхід підходить для роботи з pandas
DataFrame
. Ви можете передати список масивів або DataFrame
як значення для data
. Для x
або y
можна передати назву стовпця у DataFrame
.
import seaborn as sns import matplotlib.pyplot as plt # Loading a built-in dataset of the Titanic passengers titanic_df = sns.load_dataset('titanic') sns.countplot(data=titanic_df, x='class') plt.show()
У цьому прикладі функція створює countplot, використовуючи стовпець 'class'
з DataFrame
Titanic, показуючи, скільки записів існує для кожного унікального значення в цьому стовпці.
Swipe to start coding
- Імпортувати бібліотеку
seaborn
з псевдонімомsns
. - Імпортувати модуль
matplotlib.pyplot
з псевдонімомplt
. - Використати відповідну функцію для створення countplot.
- Використати
diamonds
як перший аргумент для вказанняDataFrame
. - Використати стовпець
'cut'
з DataFramediamonds
як категорії для countplot і відобразити категорії на осі y через другий аргумент. - Відобразити графік за допомогою відповідної функції.
Рішення
Дякуємо за ваш відгук!