Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Refactorización de Datos Planos en Tablas Relacionales | Modelado de Datos en Excel
Modelado de Datos en Excel

Refactorización de Datos Planos en Tablas Relacionales

Desliza para mostrar el menú

Una hoja amplia y plana es una sola tabla que contiene toda la información sobre cada evento: los detalles del cliente, los detalles del producto, las fechas y los valores de las transacciones están todos en un solo lugar. Es fácil de leer, pero no puede alimentar un modelo de datos relacional.

El problema de la repetición: cada pedido para Acme Corp repite el nombre del cliente, la región y el segmento. Si esos detalles cambian alguna vez, cada fila debe actualizarse individualmente, lo que conduce a inconsistencias y almacenamiento inflado.

Note
Nota

El libro de trabajo utilizado en el video es diferente al libro de trabajo utilizado en la tarea. Si deseas seguir paso a paso al instructor durante la lección, descarga el libro de trabajo del video proporcionado debajo del video antes de comenzar.

Paso 1 — Identificar y extraer tablas de dimensiones

Las tablas de dimensiones describen el quién, qué y cuándo de cada evento. Comienza con ellas porque sus límites suelen ser los más claros. Cada fila debe ser única — elimina duplicados después de pegar.

  • Tabla Customers: CustomerID (PK), CustomerName, Region, Segment;
  • Tabla Products: ProductID (PK), ProductName, Category;
  • Tabla Dates: Date (PK), Year, Month (number), Month name, Quarter.
Note
Nota

¿Por qué la tabla de fechas debe abarcar todo el año?

Los cálculos de inteligencia temporal (acumulados del año, promedios móviles, comparaciones de períodos) requieren un calendario continuo y sin huecos. Si la tabla solo contiene fechas de pedidos, los meses sin ventas faltan por completo y los cálculos fallan.

Paso 2 — Construir la tabla de hechos

La tabla de hechos registra lo que sucedió — una fila por evento. Almacena valores medibles y las claves foráneas que vinculan cada evento con sus tablas de dimensiones. Intencionalmente no contiene texto descriptivo.

  • Sales (tabla de hechos): OrderID (PK), OrderDate → Dates (FK), CustomerID → Customers (FK), ProductID → Products (FK), UnitPrice, Quantity, Total.
Note
Nota
  • PK — Clave primaria (un identificador único para cada registro en una tabla);
  • FK — Clave foránea (un campo que enlaza con una clave primaria en otra tabla).

Esquema en estrella

Las cuatro tablas forman un esquema en estrella: la tabla de hechos se encuentra en el centro y las tablas de dimensiones se distribuyen alrededor, cada una conectada por un par de clave primaria / clave foránea.

Tarea

  1. Codificación por colores de las columnas en la hoja plana amplia según el destino: clientes (azul), productos (naranja), fechas (verde), valores de hechos (amarillo);
  2. Copiar cada grupo de color a una nueva hoja. Convertir el rango en una tabla de Excel con nombre (Insert → Table);
  3. Seleccionar la columna de clave primaria y usar Data → Remove Duplicates para asegurar que cada fila sea única.
  4. Para la tabla de fechas, extender la columna de fecha para cubrir todos los días del 1 de enero al 31 de diciembre, luego agregar las columnas Year, Month, Month Name y Quarter usando =YEAR(), =MONTH(), =TEXT(B2, "MMMM") y la fórmula de trimestre ="Q"&INT((MONTH(B2)-1)/3+1).
  5. Pegar la hoja de fechas como solo valores (sin fórmulas) en una hoja limpia antes de convertirla en una tabla.
  6. Construir la tabla de hechos a partir de las columnas restantes más las tres claves externas (OrderDate, CustomerID, ProductID).

1. ¿Cuáles son los principales beneficios de refactorizar una hoja plana en una tabla de hechos más dimensiones? (Selecciona dos)

2. Al crear una dimensión de Clientes a partir de una tabla plana, ¿qué paso es esencial?

question mark

¿Cuáles son los principales beneficios de refactorizar una hoja plana en una tabla de hechos más dimensiones? (Selecciona dos)

Selecciona todas las respuestas correctas

question mark

Al crear una dimensión de Clientes a partir de una tabla plana, ¿qué paso es esencial?

Selecciona la respuesta correcta

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 6

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Sección 1. Capítulo 6
some-alt