Кореляційний аналіз
Кореляційний аналіз — це статистичний метод, який використовується для вимірювання сили та напрямку зв'язку між двома числовими змінними. Він допомагає зрозуміти, як зміни однієї змінної пов'язані зі змінами іншої.
Що таке кореляція?
Коефіцієнт кореляції (зазвичай позначається як r) знаходиться в межах від -1 до 1 і означає:
- 1: ідеальна позитивна кореляція;
- 0: відсутність кореляції;
- −1: ідеальна негативна кореляція.
Існує декілька методів визначення кореляції, але найчастіше для числових безперервних даних у R використовується кореляція Пірсона.
Кореляція між двома змінними
Ви можете використати функцію cor()
для обчислення коефіцієнта кореляції між двома змінними. Для цього потрібно передати дві колонки як параметри.
cor(df$selling_price, df$km_driven)
У результаті функція повертає значення в межах від -1 до 1.
Кореляційна матриця (декілька змінних)
Ту саму функцію можна використовувати для аналізу взаємозв'язків між кількома змінними.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
Результат зберігається у вигляді матриці, яка показує парні значення кореляції між усіма вибраними числовими змінними.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Can you explain the difference between positive and negative correlation with more examples?
How do I interpret the values in a correlation matrix?
What should I do if my data contains non-numeric columns or missing values?
Awesome!
Completion rate improved to 4
Кореляційний аналіз
Свайпніть щоб показати меню
Кореляційний аналіз — це статистичний метод, який використовується для вимірювання сили та напрямку зв'язку між двома числовими змінними. Він допомагає зрозуміти, як зміни однієї змінної пов'язані зі змінами іншої.
Що таке кореляція?
Коефіцієнт кореляції (зазвичай позначається як r) знаходиться в межах від -1 до 1 і означає:
- 1: ідеальна позитивна кореляція;
- 0: відсутність кореляції;
- −1: ідеальна негативна кореляція.
Існує декілька методів визначення кореляції, але найчастіше для числових безперервних даних у R використовується кореляція Пірсона.
Кореляція між двома змінними
Ви можете використати функцію cor()
для обчислення коефіцієнта кореляції між двома змінними. Для цього потрібно передати дві колонки як параметри.
cor(df$selling_price, df$km_driven)
У результаті функція повертає значення в межах від -1 до 1.
Кореляційна матриця (декілька змінних)
Ту саму функцію можна використовувати для аналізу взаємозв'язків між кількома змінними.
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs") # Ignores any rows with missing data
Результат зберігається у вигляді матриці, яка показує парні значення кореляції між усіма вибраними числовими змінними.
Дякуємо за ваш відгук!