Створення Діаграм Розсіювання
Свайпніть щоб показати меню
Навіщо використовувати точкові діаграми?
Точкова діаграма ідеально підходить для візуалізації зв'язків між змінними. Вона дозволяє:
- Показувати зв'язки між двома числовими змінними;
- Виявляти закономірності, кластери або викиди;
- Досліджувати кореляцію (позитивну/негативну/відсутню).
Синтаксис точкової діаграми у ggplot2
Створити точкову діаграму можна за допомогою geom_point(). Для цього потрібно вказати естетики для осей x та y.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Щоб виділити групи у даних, можна додати групувальну змінну до естетики color. Це призначить різні кольори кожній групі, що полегшує виявлення закономірностей.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Приклад: Ціна продажу vs. Пробіг
Точкова діаграма може бути використана для аналізу зв'язку між використанням автомобіля та його ціною продажу. У цьому прикладі вісь x відображає кількість пройдених кілометрів, а вісь y — ціну продажу.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Ця візуалізація часто підкреслює тенденції до знецінення — зі збільшенням пробігу ціна продажу зазвичай зменшується. Також можна виявити викиди, наприклад, автомобілі з незвично високою ціною при великому пробігу.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат