Кореляційний аналіз
Кореляційний аналіз — це статистичний метод, який використовується для вимірювання сили та напрямку зв'язку між двома числовими змінними. Він допомагає зрозуміти, як зміни однієї змінної пов'язані зі змінами іншої.
Що таке кореляція?
Коефіцієнт кореляції (зазвичай позначається як r) має значення від -1 до 1 і означає:
- 1: ідеальна позитивна кореляція;
- 0: відсутність кореляції;
- −1: ідеальна негативна кореляція.
Існує декілька методів визначення кореляції, але кореляція Пірсона є найпоширенішою для числових безперервних даних у R.
Кореляція між двома змінними
Для обчислення коефіцієнта кореляції між двома змінними можна використати функцію cor()
. Необхідно передати два стовпці як параметри.
cor(df$selling_price, df$km_driven)
У результаті функція повертає значення від -1 до 1.
Кореляційна матриця (декілька змінних)
Ту ж функцію можна використати для аналізу взаємозв'язків між кількома змінними.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
Результат зберігається у вигляді матриці, яка показує парні значення кореляції між усіма вибраними числовими змінними.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 4
Кореляційний аналіз
Свайпніть щоб показати меню
Кореляційний аналіз — це статистичний метод, який використовується для вимірювання сили та напрямку зв'язку між двома числовими змінними. Він допомагає зрозуміти, як зміни однієї змінної пов'язані зі змінами іншої.
Що таке кореляція?
Коефіцієнт кореляції (зазвичай позначається як r) має значення від -1 до 1 і означає:
- 1: ідеальна позитивна кореляція;
- 0: відсутність кореляції;
- −1: ідеальна негативна кореляція.
Існує декілька методів визначення кореляції, але кореляція Пірсона є найпоширенішою для числових безперервних даних у R.
Кореляція між двома змінними
Для обчислення коефіцієнта кореляції між двома змінними можна використати функцію cor()
. Необхідно передати два стовпці як параметри.
cor(df$selling_price, df$km_driven)
У результаті функція повертає значення від -1 до 1.
Кореляційна матриця (декілька змінних)
Ту ж функцію можна використати для аналізу взаємозв'язків між кількома змінними.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
Результат зберігається у вигляді матриці, яка показує парні значення кореляції між усіма вибраними числовими змінними.
Дякуємо за ваш відгук!