Progettazione di tabelle fatto e dimensione
Scorri per mostrare il menu
La maggior parte dei file Excel memorizza tutto in un unico foglio ampio: nomi dei clienti, categorie di prodotti, regioni e totali delle transazioni sono tutti sulla stessa riga, ripetuti migliaia di volte. Questo approccio funziona per problemi di piccola scala. Tuttavia, diventa inefficace quando i dati crescono, quando un nome cambia o quando si desidera combinarli con altre fonti.
Un modello relazionale risolve questo problema separando i dati in tabelle specifiche, ognuna delle quali descrive un solo argomento. Il concetto chiave alla base di questa separazione è la distinzione tra tabelle dei fatti e tabelle delle dimensioni.
Il file di lavoro utilizzato nel video è diverso da quello usato nell'esercitazione. Se desideri seguire passo dopo passo l'istruttore durante la lezione, scarica il file di lavoro del video fornito sotto il video prima di iniziare.
Tabelle dei fatti
Una tabella dei fatti registra eventi o transazioni — ciò che è accaduto.
Caratteristiche:
- Molte righe: una per ogni evento (un ordine, un pagamento, una visita);
- Misure: valori numerici che si desidera aggregare — Quantità, Totale, Costo, Ore;
- Chiavi esterne: colonne ID che fanno riferimento alle tabelle delle dimensioni — CustomerID, ProductID, OrderDate;
- Poco testo descrittivo: nomi, etichette e categorie appartengono alle dimensioni.
Esempi di tabelle dei fatti:
- Righe degli ordini di vendita;
- Pagamenti delle fatture;
- Visite al sito web;
- Ticket di supporto.
Tabelle delle dimensioni
Una tabella delle dimensioni descrive le entità coinvolte nei fatti come chi, cosa, dove e quando.
Caratteristiche:
- Una riga per ogni entità unica: una per cliente, una per prodotto, una per data;
- Attributi descrittivi: nomi, categorie, regioni, segmenti — principalmente testo;
- Chiave primaria: una colonna ID univoca a cui fa riferimento la tabella dei fatti.
Esempi di tabelle delle dimensioni:
- Customers (CustomerID, CustomerName, Region, Segment);
- Products (ProductID, ProductName, Category, UnitPrice);
- Dates (Date, Year, Month, Quarter);
- Employees (EmployeeID, Name, Department, Role).
Un quadro decisionale a tre domande
Per qualsiasi colonna in una tabella piatta, porsi queste domande in ordine:
D1: Questa colonna misura qualcosa che si vuole sommare o contare?—Quantity, Total, Cost → misura della tabella dei fatti;
D2: Questa colonna è un ID che collega a una descrizione altrove?—CustomerID, ProductID, OrderDate → chiave esterna della tabella dei fatti;
D3: È un'etichetta descrittiva su una persona, un prodotto o un periodo di tempo?—CustomerName, Region, Category → attributo della tabella delle dimensioni.
Se una colonna rientra nella D3, chiedersi ancora: quale soggetto descrive? Tutte le colonne che descrivono i clienti vanno in Customers. Tutte le colonne che descrivono i prodotti vanno in Products. Le colonne che descrivono le date vanno in Dates.
1. Nel foglio Orders_Flat , quale dei seguenti gruppi di colonne appartiene più chiaramente insieme in una dimensione Products ?
2. Quale affermazione descrive meglio il grain della tabella dei fatti Sales in questo capitolo?
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione