Summary  
This chapter demonstrates how to compute pairwise correlation coefficients and generate a full correlation matrix for numeric variables—covering data type conversion, missing-value handling, and use of built-in functions.  

General domain of usage  
Data analysis

**Кореляційний аналіз** — це статистичний метод, який використовується для вимірювання сили та напрямку зв'язку між двома числовими змінними. Він допомагає зрозуміти, як зміни однієї змінної пов'язані зі змінами іншої.

## Що таке кореляція?
Коефіцієнт кореляції (зазвичай позначається як $$r$$) знаходиться в межах від -1 до 1 і означає:
- **1**: ідеальна позитивна кореляція;
- **0**: відсутність кореляції;
- **−1**: ідеальна негативна кореляція.

Існує декілька методів визначення кореляції, але найчастіше для числових безперервних даних у R використовується кореляція Пірсона.

## Кореляція між двома змінними
Ви можете використати функцію `cor()` для обчислення коефіцієнта кореляції між двома змінними. Для цього потрібно передати дві колонки як параметри.
```
cor(df$selling_price, df$km_driven)
```
У результаті функція повертає значення в межах від -1 до 1.

## Кореляційна матриця (декілька змінних)
Ту саму функцію можна використовувати для аналізу взаємозв'язків між кількома змінними.
```
# Select only numeric columns
numeric_df <- df[, c("selling_price", "km_driven", "max_power", "mileage", "engine", "seats")]
# Compute correlation matrix
cor_matrix <- cor(numeric_df, use = "complete.obs")  # Ignores any rows with missing data
```
Результат зберігається у вигляді матриці, яка показує парні значення кореляції між усіма вибраними числовими змінними.

Коефіцієнт кореляції **-0.9** означає:

Отримайте практичний досвід аналізу даних у R, навчившись очищати, трансформувати та візуалізувати набори даних. Досліджуйте основні робочі процеси, такі як вибір і фільтрація даних, обробка пропущених значень і підсумовування результатів. Формуйте впевненість у підготовці даних для отримання інсайтів, звітності та глибшого статистичного аналізу.

Ознайомлення з основами аналізу даних у R. Встановлення необхідних інструментів, завантаження та перевірка наборів даних, вибір і фільтрація інформації, сортування та трансформація даних, обробка пропущених значень, підсумовування результатів для отримання глибших висновків.

Вивчення створення інформативних візуалізацій за допомогою ggplot2. Побудова стовпчикових діаграм, гістограм, графіків щільності та діаграм розсіювання з подальшим налаштуванням і вдосконаленням за допомогою стилізації та фасетування для виявлення глибших закономірностей у даних.

Поглиблення розуміння статистики для аналізу даних. Застосування описових характеристик, виявлення та обробка викидів, використання методів кореляції з візуальними інструментами, такими як теплові карти та діаграми розсіювання, для виявлення значущих взаємозв'язків.