Utformning av fakta- och dimensionstabeller
Svep för att visa menyn
De flesta Excel-arbetsböcker lagrar allting i ett enda brett blad: kundnamn, produktkategorier, regioner och transaktionssummor ligger alla på samma rad, upprepade tusentals gånger. Detta fungerar för små problem. Det blir problematiskt när datamängden växer, när ett namn ändras eller när du vill kombinera det med andra källor.
En relationsmodell löser detta genom att separera data i fokuserade tabeller, där varje tabell beskriver ett ämne. Den centrala idén bakom denna separation är skillnaden mellan faktatabeller och dimensionstabeller.
Arbetsboken som används i videon är en annan än den som används i uppgiften. Om du vill följa med steg för steg tillsammans med instruktören under lektionen, ladda ner videons arbetsbok som finns under videon innan du börjar.
Faktatabeller
En faktatabell registrerar händelser eller transaktioner — saker som har inträffat.
Egenskaper:
- Många rader: en per händelse (en order, en betalning, ett besök);
- Mått: numeriska värden som du vill summera — Antal, Totalt, Kostnad, Timmar;
- Främmande nycklar: ID-kolumner som pekar på dimensionstabeller — CustomerID, ProductID, OrderDate;
- Lite beskrivande text: namn, etiketter och kategorier hör hemma i dimensioner.
Exempel på faktatabeller:
- Orderrader för försäljning;
- Fakturabetalningar;
- Webbplatsbesök;
- Supportärenden.
Dimensionstabeller
En dimensionstabell beskriver de enheter som ingår i fakta, såsom vem, vad, var och när.
Egenskaper:
- En rad per unik enhet: en per kund, en per produkt, en per datum;
- Beskrivande attribut: namn, kategorier, regioner, segment — mestadels text;
- Primärnyckel: en unik ID-kolumn som faktatabellen refererar till.
Exempel på dimensionstabeller:
- Customers (CustomerID, CustomerName, Region, Segment);
- Products (ProductID, ProductName, Category, UnitPrice);
- Dates (Date, Year, Month, Quarter);
- Employees (EmployeeID, Name, Department, Role).
Ett beslutsramverk med tre frågor
För varje kolumn i en platt tabell, ställ dessa frågor i ordning:
F1: Mäter denna kolumn något du vill summera eller räkna?—Quantity, Total, Cost → mått i faktatabell;
F2: Är denna kolumn ett ID som länkar till en beskrivning någon annanstans?—CustomerID, ProductID, OrderDate → främmande nyckel i faktatabell;
F3: Är detta en beskrivande etikett om en person, produkt eller tidsperiod?—CustomerName, Region, Category → attribut i dimensionstabell.
Om en kolumn faller under F3, ställ ytterligare en fråga: vilket ämne beskriver den? Alla kolumner som beskriver kunder hör till Customers. Alla kolumner som beskriver produkter hör till Products. Kolumner som beskriver datum hör till Dates.
1. I Orders_Flat-arket, vilken av följande grupper av kolumner hör tydligast ihop i en Products-dimension?
2. Vilket påstående beskriver bäst kornigheten (grain) för faktatabellen Sales i detta kapitel?
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal