Entwurf von Fakten- und Dimensionstabellen
Swipe um das Menü anzuzeigen
Die meisten Excel-Arbeitsmappen speichern alle Daten in einem einzigen, breiten Arbeitsblatt: Kundennamen, Produktkategorien, Regionen und Transaktionssummen befinden sich alle in derselben Zeile und werden tausendfach wiederholt. Für kleine Aufgaben funktioniert das. Bei wachsendem Datenvolumen, Namensänderungen oder wenn Sie Daten mit anderen Quellen kombinieren möchten, stößt dieses Vorgehen an seine Grenzen.
Ein relationales Modell löst dieses Problem, indem es die Daten in spezialisierte Tabellen aufteilt, von denen jede ein bestimmtes Thema beschreibt. Das zentrale Konzept hinter dieser Aufteilung ist die Unterscheidung zwischen Faktentabellen und Dimensionstabellen.
Die im Video verwendete Arbeitsmappe unterscheidet sich von der im Arbeitsauftrag verwendeten Arbeitsmappe. Wenn Sie die Lektion Schritt für Schritt gemeinsam mit der Lehrkraft nachvollziehen möchten, laden Sie die Video-Arbeitsmappe vor Beginn der Lektion über den untenstehenden Link herunter.
Faktentabellen
Eine Faktentabelle erfasst Ereignisse oder Transaktionen – Dinge, die passiert sind.
Merkmale:
- Viele Zeilen: jeweils eine pro Ereignis (eine Bestellung, eine Zahlung, ein Besuch);
- Kennzahlen: numerische Werte, die aggregiert werden sollen – Menge, Gesamt, Kosten, Stunden;
- Fremdschlüssel: ID-Spalten, die auf Dimensionstabellen verweisen – CustomerID, ProductID, OrderDate;
- Wenig beschreibender Text: Namen, Bezeichnungen und Kategorien gehören in die Dimensionen.
Beispiele für Faktentabellen:
- Verkaufspositionszeilen;
- Rechnungszahlungen;
- Website-Besuche;
- Support-Tickets.
Dimensionstabellen
Eine Dimensionstabelle beschreibt die an Fakten beteiligten Entitäten wie wer, was, wo und wann.
Merkmale:
- Eine Zeile pro eindeutiger Entität: jeweils eine pro Kunde, eine pro Produkt, eine pro Datum;
- Beschreibende Attribute: Namen, Kategorien, Regionen, Segmente – überwiegend Text;
- Primärschlüssel: eine eindeutige ID-Spalte, auf die die Faktentabelle verweist.
Beispiele für Dimensionstabellen:
- Customers (CustomerID, CustomerName, Region, Segment);
- Products (ProductID, ProductName, Category, UnitPrice);
- Dates (Date, Year, Month, Quarter);
- Employees (EmployeeID, Name, Department, Role).
Ein Entscheidungsrahmen mit drei Fragen
Für jede Spalte in einer flachen Tabelle stellen Sie diese Fragen der Reihe nach:
F1: Misst diese Spalte etwas, das Sie aufsummieren oder zählen möchten?—Menge, Gesamt, Kosten → Faktentabellen-Kennzahl;
F2: Ist diese Spalte eine ID, die auf eine Beschreibung an anderer Stelle verweist?—CustomerID, ProductID, OrderDate → Faktentabellen-Fremdschlüssel;
F3: Ist dies ein beschreibendes Label zu einer Person, einem Produkt oder einem Zeitraum?—CustomerName, Region, Category → Dimensionstabellen-Attribut.
Wenn eine Spalte unter F3 fällt, stellen Sie noch eine Frage: Welches Thema beschreibt sie? Alle Spalten, die Kunden beschreiben, gehören in Customers. Alle Spalten, die Produkte beschreiben, gehören in Products. Spalten, die Daten beschreiben, gehören in Dates.
1. In der Orders_Flat-Tabelle: Welche der folgenden Spaltengruppen gehören am eindeutigsten zusammen in eine Products-Dimension?
2. Welche Aussage beschreibt am besten das Granularitätsniveau der Sales-Fact-Tabelle in diesem Kapitel?
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen