Platte Gegevens Herstructureren Naar Relationele Tabellen
Veeg om het menu te tonen
Een brede platte sheet is een enkele tabel die alle informatie over elk evenement bevat — klantgegevens, productgegevens, datums en transactiebedragen staan allemaal op één plek. Dit is gemakkelijk leesbaar, maar kan geen relationeel datamodel ondersteunen.
Het probleem met herhaling: elke bestelling voor Acme Corp herhaalt de klantnaam, regio en segment. Als deze gegevens ooit veranderen, moet elke rij afzonderlijk worden bijgewerkt — wat leidt tot inconsistentie en onnodig grote opslag.
De werkmap die in de video wordt gebruikt, is anders dan de werkmap die in de opdracht wordt gebruikt. Als je stap voor stap met de instructeur wilt meekijken tijdens de les, download dan de videowerkmap die onder de video wordt aangeboden voordat je begint.
Stap 1 — Identificeren en Extraheren van Dimensietabellen
Dimensietabellen beschrijven het wie, wat en wanneer van elk evenement. Begin hiermee omdat hun grenzen meestal het duidelijkst zijn. Elke rij moet uniek zijn — verwijder duplicaten na het plakken.
- Customers tabel: CustomerID (PK), CustomerName, Region, Segment;
- Products tabel: ProductID (PK), ProductName, Category;
- Dates tabel: Date (PK), Year, Month (number), Month name, Quarter.
Waarom moet de datums-tabel het volledige jaar omvatten?
Tijdintelligentie-berekeningen (jaar-tot-nu, voortschrijdende gemiddelden, periodevergelijkingen) vereisen een continue, ononderbroken kalender. Als de tabel alleen orderdatums bevat, ontbreken maanden zonder verkopen volledig en werken berekeningen niet.
Stap 2 — Opbouwen van de Feittabel
De feittabel registreert wat er is gebeurd — één rij per gebeurtenis. Het slaat meetbare waarden op en de vreemde sleutels die elke gebeurtenis koppelen aan de bijbehorende dimensietabellen. Het bevat bewust geen beschrijvende tekst.
- Sales (feittabel): OrderID (PK), OrderDate → Dates (FK), CustomerID → Customers (FK), ProductID → Products (FK), UnitPrice, Quantity, Total.
- PK — Primaire Sleutel (een unieke identificatie voor elk record in een tabel);
- FK — Vreemde Sleutel (een veld dat verwijst naar een Primaire Sleutel in een andere tabel).
Sterrenmodel
De vier tabellen vormen een sterrenmodel: de feitentabel bevindt zich in het midden en de dimensietabellen stralen naar buiten, elk verbonden door een primaire-sleutel / vreemde-sleutel-paar.
Taak
- Kolommen in het brede platte blad kleurcoderen op basis van bestemming: klanten (blauw), producten (oranje), datums (groen), factwaarden (geel);
- Elke kleurengroep kopiëren naar een nieuw blad. Het bereik omzetten naar een benoemde Excel-tabel (Invoegen → Tabel);
- De primaire sleutelkolom selecteren en Gegevens → Duplicaten verwijderen gebruiken om te zorgen dat elke rij uniek is.
- Voor de datums-tabel de datumkolom uitbreiden zodat elke dag van 1 jan tot 31 dec wordt gedekt, vervolgens de kolommen Jaar, Maand, Maandnaam en Kwartaal toevoegen met behulp van
=YEAR(),=MONTH(),=TEXT(B2, "MMMM")en de kwartaalformule="Q"&INT((MONTH(B2)-1)/3+1). - Het datums-blad plakken als alleen waarden (geen formules) in een leeg blad voordat het wordt omgezet naar een tabel.
- De facttabel opbouwen uit de overgebleven kolommen plus de drie vreemde sleutels (
OrderDate,CustomerID,ProductID).
1. Wat zijn de belangrijkste voordelen van het herstructureren van een platte sheet naar een facttabel plus dimensies? (Selecteer er twee)
2. Welke stap is essentieel bij het maken van een Customers-dimensie uit een platte tabel?
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.