Diseño de Tablas de Hechos y Dimensiones
Desliza para mostrar el menú
La mayoría de los libros de Excel almacenan todo en una sola hoja amplia: nombres de clientes, categorías de productos, regiones y totales de transacciones, todo en la misma fila, repetido miles de veces. Esto funciona para problemas pequeños. Se vuelve problemático cuando los datos crecen, cuando un nombre cambia o cuando se desea combinar con otras fuentes.
Un modelo relacional resuelve esto separando los datos en tablas especializadas, cada una describiendo un solo tema. El concepto clave detrás de esta separación es la distinción entre tablas de hechos y tablas de dimensiones.
El libro de trabajo utilizado en el video es diferente al libro de trabajo utilizado en la tarea. Si deseas seguir paso a paso al instructor durante la lección, descarga el libro de trabajo del video que se encuentra debajo del video antes de comenzar.
Tablas de hechos
Una tabla de hechos registra eventos o transacciones: cosas que han sucedido.
Características:
- Muchas filas: una por evento (un pedido, un pago, una visita);
- Medidas: valores numéricos que se desean agregar — Cantidad, Total, Costo, Horas;
- Claves foráneas: columnas de ID que apuntan a tablas de dimensiones — CustomerID, ProductID, OrderDate;
- Poco texto descriptivo: los nombres, etiquetas y categorías pertenecen a las dimensiones.
Ejemplos de tablas de hechos:
- Líneas de pedidos de ventas;
- Pagos de facturas;
- Visitas a sitios web;
- Tickets de soporte.
Tablas de dimensiones
Una tabla de dimensiones describe las entidades involucradas en los hechos, como quién, qué, dónde y cuándo.
Características:
- Una fila por entidad única: una por cliente, una por producto, una por fecha;
- Atributos descriptivos: nombres, categorías, regiones, segmentos — principalmente texto;
- Clave primaria: una columna de ID única que la tabla de hechos referencia.
Ejemplos de tablas de dimensiones:
- Customers (CustomerID, CustomerName, Region, Segment);
- Products (ProductID, ProductName, Category, UnitPrice);
- Dates (Date, Year, Month, Quarter);
- Employees (EmployeeID, Name, Department, Role).
Marco de decisión de tres preguntas
Para cualquier columna en una tabla plana, hazte estas preguntas en orden:
P1: ¿Esta columna mide algo que deseas sumar o contar?—Quantity, Total, Cost → medida de la tabla de hechos;
P2: ¿Esta columna es un ID que enlaza con una descripción en otro lugar?—CustomerID, ProductID, OrderDate → clave foránea de la tabla de hechos;
P3: ¿Es una etiqueta descriptiva sobre una persona, producto o período de tiempo?—CustomerName, Region, Category → atributo de la tabla de dimensiones.
Si una columna corresponde a P3, haz una más: ¿qué tema describe? Todas las columnas que describen clientes van en Customers. Todas las columnas que describen productos van en Products. Las columnas que describen fechas van en Dates.
1. En la hoja Orders_Flat, ¿cuál de los siguientes grupos de columnas pertenece más claramente a una dimensión Products?
2. ¿Cuál afirmación describe mejor el grano de la tabla de hechos Sales en este capítulo?
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla