Ristrutturazione dei dati piatti in tabelle relazionali
Scorri per mostrare il menu
Un foglio ampio e piatto è una singola tabella che contiene tutte le informazioni su ogni evento: dettagli del cliente, dettagli del prodotto, date e valori delle transazioni sono tutti presenti in un unico luogo. È facile da leggere ma non può supportare un modello di dati relazionale.
Il problema della ripetizione: ogni ordine per Acme Corp ripete il nome del cliente, la regione e il segmento. Se questi dettagli dovessero cambiare, ogni riga dovrebbe essere aggiornata singolarmente — il che porta a inconsistenze e a un utilizzo eccessivo dello spazio di archiviazione.
Il file di lavoro utilizzato nel video è diverso da quello utilizzato nell'esercizio. Se desideri seguire passo dopo passo l'istruttore durante la lezione, scarica il file di lavoro del video fornito sotto il video prima di iniziare.
Passaggio 1 — Identificare ed estrarre le tabelle delle dimensioni
Le tabelle delle dimensioni descrivono il chi, cosa e quando di ogni evento. Inizia da queste perché i loro confini sono solitamente i più chiari. Ogni riga deve essere unica — rimuovere i duplicati dopo l'incolla.
- Tabella Customers: CustomerID (PK), CustomerName, Region, Segment;
- Tabella Products: ProductID (PK), ProductName, Category;
- Tabella Dates: Date (PK), Year, Month (number), Month name, Quarter.
Perché la tabella delle date deve coprire l'intero anno?
I calcoli di time-intelligence (anno in corso, medie mobili, confronti tra periodi) richiedono un calendario continuo e senza interruzioni. Se la tabella contiene solo le date degli ordini, i mesi senza vendite sono completamente assenti e i calcoli risultano errati.
Passaggio 2 — Costruire la tabella dei fatti
La tabella dei fatti registra ciò che è accaduto — una riga per ogni evento. Memorizza i valori misurabili e le chiavi esterne che collegano ogni evento alle sue tabelle delle dimensioni. Intenzionalmente non contiene testo descrittivo.
- Sales (tabella dei fatti): OrderID (PK), OrderDate → Dates (FK), CustomerID → Customers (FK), ProductID → Products (FK), UnitPrice, Quantity, Total.
- PK — Chiave primaria (un identificatore univoco per ogni record in una tabella);
- FK — Chiave esterna (un campo che collega a una chiave primaria in un'altra tabella).
Schema a stella
Le quattro tabelle formano uno schema a stella: la tabella dei fatti si trova al centro e le tabelle delle dimensioni si diramano verso l'esterno, ciascuna collegata da una coppia chiave primaria/chiave esterna.
Attività
- Codifica a colori le colonne nel foglio piatto ampio in base alla destinazione: clienti (blu), prodotti (arancione), date (verde), valori di fatto (giallo);
- Copia ciascun gruppo di colore in un nuovo foglio. Converti l'intervallo in una tabella Excel con nome (Inserisci → Tabella);
- Seleziona la colonna della chiave primaria e utilizza Dati → Rimuovi duplicati per assicurarti che ogni riga sia unica.
- Per la tabella delle date, estendi la colonna delle date per coprire ogni giorno dal 1° gennaio al 31 dicembre, quindi aggiungi le colonne Anno, Mese, Nome Mese e Trimestre utilizzando
=YEAR(),=MONTH(),=TEXT(B2, "MMMM")e la formula per il trimestre="Q"&INT((MONTH(B2)-1)/3+1). - Incolla il foglio delle date come solo valori (senza formule) in un foglio pulito prima di convertirlo in una tabella.
- Costruisci la tabella dei fatti dalle colonne rimanenti più le tre chiavi esterne (
OrderDate,CustomerID,ProductID).
1. Quali sono i principali vantaggi della ristrutturazione di un foglio piatto in una tabella dei fatti più dimensioni? (Seleziona due)
2. Quando si crea una dimensione Clienti da una tabella piatta, quale passaggio è essenziale?
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione