Fakta- ja dimenssiotaulukoiden suunnittelu
Pyyhkäise näyttääksesi valikon
Useimmissa Excel-työkirjoissa kaikki tiedot tallennetaan yhteen laajaan taulukkoon: asiakasnimet, tuotekategoriat, alueet ja tapahtumien kokonaissummat ovat kaikki samalla rivillä, toistuen tuhansia kertoja. Tämä toimii pienissä ongelmissa. Se kuitenkin hajoaa, kun data kasvaa, nimi muuttuu tai haluat yhdistää sen muihin lähteisiin.
Relaatiomalli ratkaisee tämän jakamalla tiedot kohdennettuihin tauluihin, joista kukin kuvaa yhtä aihetta. Tämän jaottelun keskeinen käsite on ero faktataulujen ja ulottuvuustaulujen välillä.
Videolla käytetty työkirja on eri kuin tehtävässä käytetty työkirja. Jos haluat seurata opettajan vaiheita tunnin aikana, lataa videon alla oleva työkirja ennen aloittamista.
Faktataulut
Faktataulu tallentaa tapahtumia tai transaktioita — asioita, jotka ovat tapahtuneet.
Ominaisuudet:
- Paljon rivejä: yksi rivi per tapahtuma (yksi tilaus, yksi maksu, yksi käynti);
- Mittarit: numeeriset arvot, joita halutaan laskea yhteen — Määrä, Yhteensä, Kustannus, Tunnit;
- Vierasavaimet: ID-sarakkeet, jotka viittaavat dimensioihin — CustomerID, ProductID, OrderDate;
- Vähän kuvailevaa tekstiä: nimet, nimikkeet ja luokat kuuluvat dimensioihin.
Esimerkkejä faktatauluista:
- Myyntitilausrivit;
- Laskujen maksut;
- Verkkosivukäynnit;
- Tukipyynnöt.
Dimensiotaulut
Dimensiotaulu kuvaa faktassa mukana olevia entiteettejä, kuten kuka, mitä, missä ja milloin.
Ominaisuudet:
- Yksi rivi per yksilöllinen entiteetti: yksi per asiakas, yksi per tuote, yksi per päivämäärä;
- Kuvailevat attribuutit: nimet, luokat, alueet, segmentit — pääosin tekstiä;
- Pääavain: yksilöllinen ID-sarake, johon faktataulu viittaa.
Esimerkkejä dimensiotauluista:
- Customers (CustomerID, CustomerName, Region, Segment);
- Products (ProductID, ProductName, Category, UnitPrice);
- Dates (Date, Year, Month, Quarter);
- Employees (EmployeeID, Name, Department, Role).
Kolmen kysymyksen päätösmalli
Jokaisen sarakkeen kohdalla tasaisessa taulussa kysy nämä kysymykset järjestyksessä:
K1: Mittaako tämä sarake jotakin, jonka haluat laskea yhteen tai laskea? — Määrä, Yhteensä, Kustannus → faktataulun mittari;
K2: Onko tämä sarake ID, joka linkittää kuvaukseen muualla? — CustomerID, ProductID, OrderDate → faktataulun vierasavain;
K3: Onko tämä kuvaileva nimike henkilöstä, tuotteesta tai ajanjaksosta? — CustomerName, Region, Category → dimensiotaulun attribuutti.
Jos sarake kuuluu K3:een, kysy vielä yksi: mitä aihetta se kuvaa? Kaikki asiakkaisiin liittyvät sarakkeet kuuluvat Customers-tauluun. Kaikki tuotteisiin liittyvät sarakkeet kuuluvat Products-tauluun. Päivämääriä kuvaavat sarakkeet kuuluvat Dates-tauluun.
1. Taulukossa Orders_Flat mikä seuraavista sarakeryhmistä kuuluu selkeimmin yhteen Products -dimensioon?
2. Mikä seuraavista väittämistä kuvaa parhaiten tämän luvun Sales-faktataulun grainin?
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme