Conception des tables de faits et de dimensions
Glissez pour afficher le menu
La plupart des classeurs Excel stockent toutes les données dans une seule feuille large : noms des clients, catégories de produits, régions et totaux des transactions sont tous placés sur la même ligne, répétés des milliers de fois. Cette méthode convient pour des problèmes de petite taille. Elle devient inefficace lorsque les données augmentent, lorsqu’un nom change ou lorsque vous souhaitez les combiner avec d’autres sources.
Un modèle relationnel résout ce problème en séparant les données dans des tables spécialisées, chacune décrivant un seul sujet. Le concept clé derrière cette séparation est la distinction entre tables de faits et tables de dimensions.
Le classeur utilisé dans la vidéo est différent de celui utilisé dans l’exercice. Si vous souhaitez suivre l’instructeur étape par étape pendant la leçon, téléchargez le classeur vidéo fourni sous la vidéo avant de commencer.
Tables de faits
Une table de faits enregistre des événements ou des transactions — des actions qui se sont produites.
Caractéristiques :
- De nombreuses lignes : une par événement (une commande, un paiement, une visite) ;
- Mesures : valeurs numériques à agréger — Quantité, Total, Coût, Heures ;
- Clés étrangères : colonnes d'identifiants pointant vers les tables de dimensions — CustomerID, ProductID, OrderDate ;
- Peu de texte descriptif : les noms, libellés et catégories appartiennent aux dimensions.
Exemples de tables de faits :
- Lignes de commandes de vente ;
- Paiements de factures ;
- Visites de sites web ;
- Tickets de support.
Tables de dimensions
Une table de dimensions décrit les entités impliquées dans les faits, telles que qui, quoi, où et quand.
Caractéristiques :
- Une ligne par entité unique : une par client, une par produit, une par date ;
- Attributs descriptifs : noms, catégories, régions, segments — principalement du texte ;
- Clé primaire : une colonne d'identifiant unique référencée par la table de faits.
Exemples de tables de dimensions :
- Customers (CustomerID, CustomerName, Region, Segment) ;
- Products (ProductID, ProductName, Category, UnitPrice) ;
- Dates (Date, Year, Month, Quarter) ;
- Employees (EmployeeID, Name, Department, Role).
Un cadre décisionnel en trois questions
Pour toute colonne dans une table plate, posez ces questions dans l'ordre :
Q1 : Cette colonne mesure-t-elle quelque chose que vous souhaitez additionner ou compter ? — Quantity, Total, Cost → mesure de la table de faits ;
Q2 : Cette colonne est-elle un identifiant qui fait le lien vers une description ailleurs ? — CustomerID, ProductID, OrderDate → clé étrangère de la table de faits ;
Q3 : S'agit-il d'un libellé descriptif concernant une personne, un produit ou une période ? — CustomerName, Region, Category → attribut de la table de dimensions.
Si une colonne correspond à Q3, posez-en une de plus : quel sujet décrit-elle ? Toutes les colonnes décrivant des clients vont dans Customers. Toutes les colonnes décrivant des produits vont dans Products. Les colonnes décrivant des dates vont dans Dates.
1. Dans la feuille Orders_Flat, lequel des groupes de colonnes suivants appartient le plus clairement à une dimension Products ?
2. Quelle affirmation décrit le mieux le grain de la table de faits Sales dans ce chapitre ?
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion