Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Рефакторинг плоских даних у реляційні таблиці | Підготовка даних
Моделювання Даних в Excel

Рефакторинг плоских даних у реляційні таблиці

Свайпніть щоб показати меню

Широка плоска таблиця — це єдина таблиця, що містить усю інформацію про кожну подію: дані клієнта, дані про продукт, дати та значення транзакцій знаходяться в одному місці. Її легко читати, але вона не може слугувати основою для реляційної моделі даних.

Проблема з повторенням: кожне замовлення для Acme Corp повторює ім’я клієнта, регіон і сегмент. Якщо ці дані зміняться, кожен рядок доведеться оновлювати окремо — це призводить до неузгодженості та зайвого використання пам’яті.

Note
Примітка

Робоча книга, використана у відео, відрізняється від робочої книги, використаної у завданні. Якщо ви хочете крок за кроком повторювати дії інструктора під час уроку, завантажте робочу книгу для відео, розміщену під відео, перед початком.

Крок 1 — Визначення та виділення вимірних таблиць

Вимірні таблиці описують хто, що і коли для кожної події. Починайте з них, оскільки їхні межі зазвичай найчіткіші. Кожен рядок має бути унікальним — видаліть дублікати після вставки.

  • Customers table: CustomerID (PK), CustomerName, Region, Segment;
  • Products table: ProductID (PK), ProductName, Category;
  • Dates table: Date (PK), Year, Month (number), Month name, Quarter.
Note
Примітка

Чому таблиця дат повинна охоплювати весь рік?

Обчислення на основі часу (з початку року, ковзні середні, порівняння періодів) потребують безперервного календаря без пропусків. Якщо таблиця містить лише дати замовлень, місяці без продажів будуть повністю відсутні, і обчислення не працюватимуть.

Крок 2 — Побудова фактної таблиці

Фактна таблиця фіксує, що відбулося — один рядок на подію. Вона зберігає вимірювані значення та зовнішні ключі, які пов'язують кожну подію з її вимірними таблицями. Описового тексту навмисно не містить.

  • Sales (fact table): OrderID (PK), OrderDate → Dates (FK), CustomerID → Customers (FK), ProductID → Products (FK), UnitPrice, Quantity, Total.
Note
Примітка
  • PK — Первинний ключ (унікальний ідентифікатор для кожного запису в таблиці);
  • FK — Зовнішній ключ (поле, що посилається на первинний ключ в іншій таблиці).

Зіркова схема

Чотири таблиці утворюють зіркову схему: фактова таблиця знаходиться в центрі, а таблиці вимірів розташовані навколо неї, кожна з'єднана парою первинний ключ / зовнішній ключ.

Завдання

  1. Виділити кольором стовпці у широкій плоскій таблиці за призначенням: клієнти (синій), продукти (помаранчевий), дати (зелений), фактичні значення (жовтий);
  2. Скопіювати кожну кольорову групу на новий аркуш. Перетворити діапазон на іменовану таблицю Excel (Вставлення → Таблиця);
  3. Вибрати стовпець з первинним ключем і скористатися Дані → Видалити дублікати, щоб кожен рядок був унікальним.
  4. Для таблиці дат розширити стовпець дат, щоб охопити кожен день з 1 січня по 31 грудня, потім додати стовпці Year, Month, Month Name і Quarter за допомогою =YEAR(), =MONTH(), =TEXT(B2, "MMMM") та формули кварталу ="Q"&INT((MONTH(B2)-1)/3+1).
  5. Вставити аркуш дат як тільки значення (без формул) у чистий аркуш перед перетворенням на таблицю.
  6. Побудувати фактну таблицю з решти стовпців плюс три зовнішні ключі (OrderDate, CustomerID, ProductID).

1. Які основні переваги рефакторингу плоскої таблиці у факт та виміри? (Оберіть дві)

2. Який крок є обов'язковим при створенні виміру Customers з плоскої таблиці?

question mark

Які основні переваги рефакторингу плоскої таблиці у факт та виміри? (Оберіть дві)

Виберіть усі правильні відповіді

question mark

Який крок є обов'язковим при створенні виміру Customers з плоскої таблиці?

Виберіть правильну відповідь

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 4

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Секція 2. Розділ 4
some-alt