Projetando Tabelas Fato e Dimensão
Deslize para mostrar o menu
A maioria das planilhas do Excel armazena tudo em uma única aba ampla: nomes de clientes, categorias de produtos, regiões e totais de transações, todos na mesma linha, repetidos milhares de vezes. Isso funciona para problemas pequenos. Porém, apresenta falhas quando os dados crescem, quando um nome é alterado ou quando se deseja combinar com outras fontes.
Um modelo relacional resolve isso ao separar os dados em tabelas específicas, cada uma descrevendo um assunto. O conceito-chave por trás dessa separação é a distinção entre tabelas fato e tabelas dimensão.
A pasta de trabalho utilizada no vídeo é diferente da pasta de trabalho usada na tarefa. Se desejar acompanhar passo a passo com o instrutor durante a aula, faça o download da pasta de trabalho do vídeo disponível abaixo do vídeo antes de começar.
Tabelas de Fatos
Uma tabela de fatos registra eventos ou transações — coisas que aconteceram.
Características:
- Muitas linhas: uma por evento (um pedido, um pagamento, uma visita);
- Métricas: valores numéricos que você deseja agregar — Quantidade, Total, Custo, Horas;
- Chaves estrangeiras: colunas de ID que apontam para tabelas de dimensões — CustomerID, ProductID, OrderDate;
- Pouco texto descritivo: nomes, rótulos e categorias pertencem às dimensões.
Exemplos de tabelas de fatos:
- Linhas de pedidos de vendas;
- Pagamentos de faturas;
- Visitas ao site;
- Chamados de suporte.
Tabelas de Dimensões
Uma tabela de dimensões descreve as entidades envolvidas nos fatos, como quem, o quê, onde e quando.
Características:
- Uma linha por entidade única: uma por cliente, uma por produto, uma por data;
- Atributos descritivos: nomes, categorias, regiões, segmentos — principalmente texto;
- Chave primária: uma coluna de ID única que a tabela de fatos referencia.
Exemplos de tabelas de dimensões:
- Customers (CustomerID, CustomerName, Region, Segment);
- Products (ProductID, ProductName, Category, UnitPrice);
- Dates (Date, Year, Month, Quarter);
- Employees (EmployeeID, Name, Department, Role).
Estrutura de Decisão em Três Perguntas
Para qualquer coluna em uma tabela plana, faça estas perguntas na ordem:
Q1: Esta coluna mede algo que você deseja somar ou contar?—Quantity, Total, Cost → medida da tabela de fatos;
Q2: Esta coluna é um ID que faz ligação com uma descrição em outro lugar?—CustomerID, ProductID, OrderDate → chave estrangeira da tabela de fatos;
Q3: É um rótulo descritivo sobre uma pessoa, produto ou período de tempo?—CustomerName, Region, Category → atributo da tabela de dimensões.
Se uma coluna se enquadrar em Q3, faça mais uma pergunta: qual assunto ela descreve? Todas as colunas que descrevem clientes vão em Customers. Todas as colunas que descrevem produtos vão em Products. Colunas que descrevem datas vão em Dates.
1. Na planilha Orders_Flat, qual dos seguintes grupos de colunas mais claramente pertencem juntos em uma dimensão Products?
2. Qual afirmação melhor descreve o grão da tabela fato Sales neste capítulo?
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo