Reorganización de datos planos en tablas relacionales
Desliza para mostrar el menú
Una hoja plana y amplia es una sola tabla que contiene toda la información sobre cada evento: los detalles del cliente, los detalles del producto, las fechas y los valores de las transacciones están todos en un solo lugar. Es fácil de leer, pero no puede alimentar un modelo de datos relacional.
El problema de la repetición: cada pedido para Acme Corp repite el nombre del cliente, la región y el segmento. Si esos detalles cambian alguna vez, cada fila debe actualizarse individualmente, lo que conduce a inconsistencias y almacenamiento innecesariamente grande.
El libro de trabajo utilizado en el video es diferente al libro de trabajo utilizado en la tarea. Si deseas seguir paso a paso al instructor durante la lección, descarga el libro de trabajo del video que se encuentra debajo del video antes de comenzar.
Paso 1 — Identificar y extraer tablas de dimensiones
Las tablas de dimensiones describen el quién, qué y cuándo de cada evento. Comienza con ellas porque sus límites suelen ser los más claros. Cada fila debe ser única — elimina duplicados después de pegar.
- Tabla Customers: CustomerID (PK), CustomerName, Region, Segment;
- Tabla Products: ProductID (PK), ProductName, Category;
- Tabla Dates: Date (PK), Year, Month (number), Month name, Quarter.
¿Por qué la tabla de fechas debe abarcar todo el año?
Los cálculos de inteligencia temporal (acumulado anual, promedios móviles, comparaciones de periodos) requieren un calendario continuo y sin huecos. Si la tabla solo contiene fechas de pedidos, los meses sin ventas faltan por completo y los cálculos fallan.
Paso 2 — Construir la tabla de hechos
La tabla de hechos registra lo que sucedió — una fila por evento. Almacena valores medibles y las claves foráneas que vinculan cada evento con sus tablas de dimensiones. Intencionalmente no contiene texto descriptivo.
- Sales (tabla de hechos): OrderID (PK), OrderDate → Dates (FK), CustomerID → Customers (FK), ProductID → Products (FK), UnitPrice, Quantity, Total.
- PK — Clave primaria (un identificador único para cada registro en una tabla);
- FK — Clave foránea (un campo que enlaza con una clave primaria en otra tabla).
Esquema en estrella
Las cuatro tablas forman un esquema en estrella: la tabla de hechos se sitúa en el centro y las tablas de dimensiones se distribuyen alrededor, cada una conectada por un par de clave primaria / clave foránea.
Tarea
- Codificar por colores las columnas en la hoja plana amplia según el destino: customers (azul), products (naranja), dates (verde), fact values (amarillo);
- Copiar cada grupo de color a una nueva hoja. Convertir el rango en una tabla de Excel con nombre (Insertar → Tabla);
- Seleccionar la columna de clave primaria y usar Datos → Quitar duplicados para asegurar que cada fila sea única.
- Para la tabla de dates, extender la columna de fecha para cubrir todos los días del 1 de enero al 31 de diciembre, luego agregar las columnas Year, Month, Month Name y Quarter usando
=YEAR(),=MONTH(),=TEXT(B2, "MMMM")y la fórmula para el trimestre="Q"&INT((MONTH(B2)-1)/3+1). - Pegar la hoja de dates como solo valores (sin fórmulas) en una hoja limpia antes de convertirla en una tabla.
- Construir la fact table a partir de las columnas restantes más las tres claves externas (
OrderDate,CustomerID,ProductID).
1. ¿Cuáles son los principales beneficios de refactorizar una hoja plana en una tabla de hechos más dimensiones? (Selecciona dos)
2. Al crear una dimensión de Clientes a partir de una tabla plana, ¿qué paso es esencial?
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla