Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Кореляційний Аналіз | Базовий Статистичний Аналіз
Аналіз Даних у R

Кореляційний Аналіз

Свайпніть щоб показати меню

Кореляційний аналіз — це статистичний метод, який використовується для вимірювання сили та напрямку зв'язку між двома числовими змінними. Він допомагає зрозуміти, як зміни однієї змінної пов'язані зі змінами іншої.

Що таке кореляція?

Коефіцієнт кореляції (зазвичай позначається як rr) має значення від -1 до 1 і означає:

  • 1: ідеальна позитивна кореляція;
  • 0: відсутність кореляції;
  • −1: ідеальна негативна кореляція.

Існує кілька типів методів кореляції, але кореляція Пірсона є найпоширенішою для числових безперервних даних у R.

Кореляція між двома змінними

Для обчислення коефіцієнта кореляції між двома змінними можна використати функцію cor(). Необхідно передати дві колонки як параметри.

cor(df$selling_price, df$km_driven)

У результаті функція повертає значення від -1 до 1.

Матриця кореляції (декілька змінних)

Ту ж функцію можна використовувати для аналізу взаємозв'язків між кількома змінними.

# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")  # Ignores any rows with missing data

Результат зберігається у вигляді матриці, яка показує парні значення кореляції між усіма вибраними числовими змінними.

question mark

Коефіцієнт кореляції -0,9 вказує на:

Виберіть правильну відповідь

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 5

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Секція 3. Розділ 5
some-alt