Utformning av fakta- och dimensionstabeller
Svep för att visa menyn
De flesta Excel-arbetsböcker lagrar allting i ett enda brett blad: kundnamn, produktkategorier, regioner och transaktionssummor ligger alla på samma rad, upprepade tusentals gånger. Detta fungerar för små problem. Det blir problematiskt när datamängden växer, när ett namn ändras eller när du vill kombinera det med andra källor.
En relationsmodell löser detta genom att separera data i fokuserade tabeller, där varje tabell beskriver ett ämne. Den centrala idén bakom denna uppdelning är skillnaden mellan faktatabeller och dimensionstabeller.
Arbetsboken som används i videon är en annan än den som används i uppgiften. Om du vill följa med steg för steg tillsammans med instruktören under lektionen, ladda ner videons arbetsbok som finns under videon innan du börjar.
Faktatabeller
En faktatabell registrerar händelser eller transaktioner — saker som har hänt.
Kännetecken:
- Många rader: en per händelse (en order, en betalning, ett besök);
- Mått: numeriska värden du vill summera — Kvantitet, Totalt, Kostnad, Timmar;
- Främmande nycklar: ID-kolumner som pekar på dimensionstabeller — CustomerID, ProductID, OrderDate;
- Lite beskrivande text: namn, etiketter och kategorier hör hemma i dimensioner.
Exempel på faktatabeller:
- Orderrader för försäljning;
- Fakturabetalningar;
- Webbplatsbesök;
- Supportärenden.
Dimensionstabeller
En dimensionstabell beskriver de enheter som ingår i fakta, såsom vem, vad, var och när.
Kännetecken:
- En rad per unik enhet: en per kund, en per produkt, en per datum;
- Beskrivande attribut: namn, kategorier, regioner, segment — mestadels text;
- Primärnyckel: en unik ID-kolumn som faktatabellen refererar till.
Exempel på dimensionstabeller:
- Customers (CustomerID, CustomerName, Region, Segment);
- Products (ProductID, ProductName, Category, UnitPrice);
- Dates (Date, Year, Month, Quarter);
- Employees (EmployeeID, Name, Department, Role).
Ett trefråge-beslutsramverk
För varje kolumn i en platt tabell, ställ dessa frågor i ordning:
F1: Mäter denna kolumn något du vill summera eller räkna?—Quantity, Total, Cost → mått i faktatabell;
F2: Är denna kolumn ett ID som länkar till en beskrivning någon annanstans?—CustomerID, ProductID, OrderDate → främmande nyckel i faktatabell;
F3: Är detta en beskrivande etikett om en person, produkt eller tidsperiod?—CustomerName, Region, Category → attribut i dimensionstabell.
Om en kolumn hamnar under F3, ställ en fråga till: vilket ämne beskriver den? Alla kolumner som beskriver kunder hamnar i Customers. Alla kolumner som beskriver produkter hamnar i Products. Kolumner som beskriver datum hamnar i Dates.
1. I Orders_Flat-arket, vilken av följande grupper av kolumner hör tydligast ihop i en Products-dimension?
2. Vilket påstående beskriver bäst kornigheten för faktatabellen Sales i detta kapitel?
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal