Візуалізація Кореляцій за Допомогою Діаграм Розсіювання
Свайпніть щоб показати меню
Хоча кореляційні теплові карти надають зведену інформацію про лінійні зв'язки між змінними, вони не дозволяють виявити нелінійні залежності. У таких випадках більш корисними є діаграми розсіювання.
Навіщо використовувати діаграми розсіювання?
Діаграми розсіювання — це простий, але потужний спосіб візуалізувати взаємозв'язок між двома числовими змінними. Вони дозволяють виявляти як лінійні, так і нелінійні тенденції, підкреслювати викиди або аномалії та надають глибше розуміння зв'язків, які можуть бути лише абстрактно представлені на кореляційній тепловій карті. Завдяки відображенню окремих точок даних діаграми розсіювання дають чітке й інтуїтивне уявлення про взаємодію змінних.
Приклад: Selling Price vs. Max Power
Діаграма розсіювання може бути використана для аналізу того, як потужність автомобіля впливає на його ринкову вартість. У цьому випадку вісь x відображає максимальну потужність, а вісь y — ціну продажу.
ggplot(data = df, aes(x = max_power, y = selling_price)) +
geom_point() +
labs(title = "Scatter Plot of Selling Price vs. Max Power",
x = "Max Power",
y = "Selling Price")
Ця візуалізація дозволяє легко побачити, чи існує позитивний лінійний зв'язок, коли більша потужність зазвичай відповідає вищій ціні продажу.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат