Створення Діаграм Розсіювання
Свайпніть щоб показати меню
Навіщо використовувати точкові діаграми?
Точкова діаграма ідеально підходить для візуалізації зв'язків між змінними. Вона може використовуватися для:
- Відображення зв'язків між двома числовими змінними;
- Виявлення закономірностей, кластерів або аномалій;
- Дослідження кореляції (позитивної/негативної/відсутньої).
Синтаксис точкової діаграми у ggplot2
Точкову діаграму можна створити за допомогою geom_point(). Для цього потрібно вказати естетики для осей x та y.
ggplot(data = df, aes(x = variable_x, y = variable_y)) +
geom_point()
Щоб виділити групи у даних, можна додати групувальну змінну до естетики color. Це призначить різні кольори для кожної групи, що полегшує виявлення закономірностей.
ggplot(data = df, aes(x = variable_x, y = variable_y, color = group_var)) +
geom_point()
Приклад: ціна продажу vs. кілометраж
Точкова діаграма може бути використана для аналізу зв'язку між використанням автомобіля та його ціною продажу. У цьому прикладі вісь x відображає кількість кілометрів пробігу, а вісь y — ціну продажу.
ggplot(df, aes(x = km_driven, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Kilometers Driven",
x = "Kilometers Driven",
y = "Selling Price")
Ця візуалізація часто демонструє тенденції до знецінення — зі збільшенням пробігу ціна продажу зазвичай зменшується. Також можна виявити аномалії, наприклад, автомобілі з незвично високою ціною при великому пробігу.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат