Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Кореляційний аналіз | Базовий Статистичний Аналіз
Аналіз Даних у R

bookКореляційний аналіз

Кореляційний аналіз — це статистичний метод, який використовується для вимірювання сили та напрямку зв'язку між двома числовими змінними. Він допомагає зрозуміти, як зміни однієї змінної пов'язані зі змінами іншої.

Що таке кореляція?

Коефіцієнт кореляції (зазвичай позначається як rr) має значення від -1 до 1 і означає:

  • 1: ідеальна позитивна кореляція;
  • 0: відсутність кореляції;
  • −1: ідеальна негативна кореляція.

Існує декілька методів визначення кореляції, але кореляція Пірсона є найпоширенішою для числових безперервних даних у R.

Кореляція між двома змінними

Для обчислення коефіцієнта кореляції між двома змінними можна використати функцію cor(). Необхідно передати два стовпці як параметри.

cor(df$selling_price, df$km_driven)

У результаті функція повертає значення від -1 до 1.

Кореляційна матриця (декілька змінних)

Ту ж функцію можна використати для аналізу взаємозв'язків між кількома змінними.

# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")  # Ignores any rows with missing data

Результат зберігається у вигляді матриці, яка показує парні значення кореляції між усіма вибраними числовими змінними.

question mark

Коефіцієнт кореляції -0.9 означає:

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 5

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Awesome!

Completion rate improved to 4

bookКореляційний аналіз

Свайпніть щоб показати меню

Кореляційний аналіз — це статистичний метод, який використовується для вимірювання сили та напрямку зв'язку між двома числовими змінними. Він допомагає зрозуміти, як зміни однієї змінної пов'язані зі змінами іншої.

Що таке кореляція?

Коефіцієнт кореляції (зазвичай позначається як rr) має значення від -1 до 1 і означає:

  • 1: ідеальна позитивна кореляція;
  • 0: відсутність кореляції;
  • −1: ідеальна негативна кореляція.

Існує декілька методів визначення кореляції, але кореляція Пірсона є найпоширенішою для числових безперервних даних у R.

Кореляція між двома змінними

Для обчислення коефіцієнта кореляції між двома змінними можна використати функцію cor(). Необхідно передати два стовпці як параметри.

cor(df$selling_price, df$km_driven)

У результаті функція повертає значення від -1 до 1.

Кореляційна матриця (декілька змінних)

Ту ж функцію можна використати для аналізу взаємозв'язків між кількома змінними.

# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")  # Ignores any rows with missing data

Результат зберігається у вигляді матриці, яка показує парні значення кореляції між усіма вибраними числовими змінними.

question mark

Коефіцієнт кореляції -0.9 означає:

Select the correct answer

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 5
some-alt