Створення Гістограм
Свайпніть щоб показати меню
Навіщо використовувати гістограми?
Гістограми використовуються для візуалізації розподілу неперервних (числових) даних. Вони показують, як дані розподілені по діапазонах (бінів) та допомагають:
- Виявляти асиметрію, викиди або пропуски;
- Аналізувати частотний розподіл;
- Швидко оцінити, чи дані мають нормальний розподіл.
Найкраще підходять для змінних, таких як ціна, пробіг або вік.
Синтаксис гістограми у ggplot2
Гістограму можна створити за допомогою geom_histogram(), де змінна x повинна бути числовою.
ggplot(data = df, aes(x = variable)) +
geom_histogram()
Зовнішній вигляд гістограми можна налаштувати за допомогою аргументів, таких як bins (кількість бінів), fill (колір стовпців), color (колір межі) та theme для стилізації.
Приклад: розподіл цін продажу
Гістограма може бути використана для аналізу розподілу цін на автомобілі у наборі даних. У цьому прикладі стовпці заповнені сталево-синім кольором і мають чорну обводку, а для зрозумілості додані підписи та мінімалістична тема.
ggplot(data = df, aes(x = selling_price)) +
geom_histogram(fill = "steelblue", color = "black") +
labs(title = "Distribution of Selling Prices",
x = "Selling Price (in PKR)",
y = "Count") +
theme_minimal()
Цей графік відображає загальну форму розподілу цін продажу, що дозволяє легко побачити, чи більшість автомобілів знаходиться в певному ціновому діапазоні, або ж є викиди з високими чи низькими цінами.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат