Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Кореляційний аналіз | Базовий Статистичний Аналіз
Аналіз Даних у R

bookКореляційний аналіз

Кореляційний аналіз — це статистичний метод, який використовується для вимірювання сили та напрямку зв'язку між двома числовими змінними. Він допомагає зрозуміти, як зміни однієї змінної пов'язані зі змінами іншої.

Що таке кореляція?

Коефіцієнт кореляції (зазвичай позначається як rr) знаходиться в межах від -1 до 1 і означає:

  • 1: ідеальна позитивна кореляція;
  • 0: відсутність кореляції;
  • −1: ідеальна негативна кореляція.

Існує декілька методів визначення кореляції, але найчастіше для числових безперервних даних у R використовується кореляція Пірсона.

Кореляція між двома змінними

Ви можете використати функцію cor() для обчислення коефіцієнта кореляції між двома змінними. Для цього потрібно передати дві колонки як параметри.

cor(df$selling_price, df$km_driven)

У результаті функція повертає значення в межах від -1 до 1.

Кореляційна матриця (декілька змінних)

Ту саму функцію можна використовувати для аналізу взаємозв'язків між кількома змінними.

# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")  # Ignores any rows with missing data

Результат зберігається у вигляді матриці, яка показує парні значення кореляції між усіма вибраними числовими змінними.

question mark

Коефіцієнт кореляції -0.9 означає:

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 5

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain the difference between positive and negative correlation with more examples?

How do I interpret the values in a correlation matrix?

What should I do if my data contains non-numeric columns or missing values?

Awesome!

Completion rate improved to 4

bookКореляційний аналіз

Свайпніть щоб показати меню

Кореляційний аналіз — це статистичний метод, який використовується для вимірювання сили та напрямку зв'язку між двома числовими змінними. Він допомагає зрозуміти, як зміни однієї змінної пов'язані зі змінами іншої.

Що таке кореляція?

Коефіцієнт кореляції (зазвичай позначається як rr) знаходиться в межах від -1 до 1 і означає:

  • 1: ідеальна позитивна кореляція;
  • 0: відсутність кореляції;
  • −1: ідеальна негативна кореляція.

Існує декілька методів визначення кореляції, але найчастіше для числових безперервних даних у R використовується кореляція Пірсона.

Кореляція між двома змінними

Ви можете використати функцію cor() для обчислення коефіцієнта кореляції між двома змінними. Для цього потрібно передати дві колонки як параметри.

cor(df$selling_price, df$km_driven)

У результаті функція повертає значення в межах від -1 до 1.

Кореляційна матриця (декілька змінних)

Ту саму функцію можна використовувати для аналізу взаємозв'язків між кількома змінними.

# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")  # Ignores any rows with missing data

Результат зберігається у вигляді матриці, яка показує парні значення кореляції між усіма вибраними числовими змінними.

question mark

Коефіцієнт кореляції -0.9 означає:

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 5
some-alt