Refatoração de Dados Planos em Tabelas Relacionais
Deslize para mostrar o menu
Uma planilha ampla e plana é uma única tabela que contém todas as informações sobre cada evento — detalhes do cliente, detalhes do produto, datas e valores das transações estão todos em um só lugar. É fácil de ler, mas não pode sustentar um modelo de dados relacional.
O problema da repetição: cada pedido para a Acme Corp repete o nome do cliente, região e segmento. Se esses detalhes mudarem, cada linha deve ser atualizada individualmente — o que leva à inconsistência e ao aumento do armazenamento.
A pasta de trabalho utilizada no vídeo é diferente da pasta de trabalho usada na tarefa. Se desejar acompanhar passo a passo com o instrutor durante a aula, faça o download da pasta de trabalho do vídeo disponibilizada abaixo do vídeo antes de começar.
Etapa 1 — Identificação e Extração das Tabelas de Dimensão
Tabelas de dimensão descrevem o quem, o quê e o quando de cada evento. Comece por elas, pois seus limites geralmente são mais claros. Cada linha deve ser única — remova duplicatas após colar.
- Tabela Customers: CustomerID (PK), CustomerName, Region, Segment;
- Tabela Products: ProductID (PK), ProductName, Category;
- Tabela Dates: Date (PK), Year, Month (number), Month name, Quarter.
Por que a tabela de datas deve abranger o ano inteiro?
Cálculos de inteligência temporal (acumulado do ano, médias móveis, comparações de períodos) exigem um calendário contínuo, sem lacunas. Se a tabela contiver apenas datas de pedidos, meses sem vendas estarão totalmente ausentes e os cálculos serão prejudicados.
Etapa 2 — Construção da Tabela de Fatos
A tabela de fatos registra o que aconteceu — uma linha por evento. Ela armazena valores mensuráveis e as chaves estrangeiras que conectam cada evento às suas tabelas de dimensão. Intencionalmente, não contém textos descritivos.
- Sales (tabela de fatos): OrderID (PK), OrderDate → Dates (FK), CustomerID → Customers (FK), ProductID → Products (FK), UnitPrice, Quantity, Total.
- PK — Chave Primária (um identificador único para cada registro em uma tabela);
- FK — Chave Estrangeira (um campo que faz referência a uma Chave Primária em outra tabela).
Esquema Estrela
As quatro tabelas formam um esquema estrela: a tabela de fatos fica no centro e as tabelas de dimensão se distribuem ao redor, cada uma conectada por um par de chave primária/chave estrangeira.
Tarefa
- Codificar as colunas da planilha ampla e plana por destino: clientes (azul), produtos (laranja), datas (verde), valores de fatos (amarelo);
- Copiar cada grupo de cor para uma nova planilha. Converter o intervalo em uma tabela nomeada do Excel (Inserir → Tabela);
- Selecionar a coluna de chave primária e usar Dados → Remover Duplicatas para garantir que cada linha seja única.
- Para a tabela de datas, estender a coluna de datas para cobrir todos os dias de 1º de janeiro a 31 de dezembro, depois adicionar as colunas Ano, Mês, Nome do Mês e Trimestre usando
=YEAR(),=MONTH(),=TEXT(B2, "MMMM")e a fórmula de trimestre="Q"&INT((MONTH(B2)-1)/3+1). - Colar a planilha de datas como somente valores (sem fórmulas) em uma planilha limpa antes de converter em tabela.
- Construir a tabela de fatos a partir das colunas restantes mais as três chaves estrangeiras (
OrderDate,CustomerID,ProductID).
1. Quais são os principais benefícios de refatorar uma planilha plana em uma tabela fato mais dimensões? (Selecione dois)
2. Ao criar uma dimensão de Clientes a partir de uma tabela plana, qual etapa é essencial?
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo