Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Fakta- ja dimenssiotaulukoiden suunnittelu | Datan valmistelu
Excel-tietomallinnus

Fakta- ja dimenssiotaulukoiden suunnittelu

Pyyhkäise näyttääksesi valikon

Useimmissa Excel-työkirjoissa kaikki tiedot tallennetaan yhteen laajaan taulukkoon: asiakasnimet, tuotekategoriat, alueet ja tapahtumien kokonaissummat ovat kaikki samalla rivillä, toistuen tuhansia kertoja. Tämä toimii pienissä ongelmissa. Se kuitenkin hajoaa, kun data kasvaa, nimi muuttuu tai haluat yhdistää sen muihin lähteisiin.

Relaatiomalli ratkaisee tämän jakamalla tiedot kohdennettuihin tauluihin, joista kukin kuvaa yhtä aihetta. Tämän jaottelun keskeinen käsite on ero faktataulujen ja ulottuvuustaulujen välillä.

Note
Huomio

Videolla käytetty työkirja on eri kuin tehtävässä käytetty työkirja. Jos haluat seurata opettajan vaiheita tunnin aikana, lataa videon alla oleva työkirja ennen aloittamista.

Faktataulut

Faktataulu tallentaa tapahtumia tai transaktioita — asioita, jotka ovat tapahtuneet.

Ominaisuudet:

  • Paljon rivejä: yksi rivi per tapahtuma (yksi tilaus, yksi maksu, yksi käynti);
  • Mittarit: numeeriset arvot, joita halutaan laskea yhteen — Määrä, Yhteensä, Kustannus, Tunnit;
  • Vierasavaimet: ID-sarakkeet, jotka viittaavat dimensioihin — CustomerID, ProductID, OrderDate;
  • Vähän kuvailevaa tekstiä: nimet, nimikkeet ja luokat kuuluvat dimensioihin.

Esimerkkejä faktatauluista:

  • Myyntitilausrivit;
  • Laskujen maksut;
  • Verkkosivukäynnit;
  • Tukipyynnöt.

Dimensiotaulut

Dimensiotaulu kuvaa faktassa mukana olevia entiteettejä, kuten kuka, mitä, missä ja milloin.

Ominaisuudet:

  • Yksi rivi per yksilöllinen entiteetti: yksi per asiakas, yksi per tuote, yksi per päivämäärä;
  • Kuvailevat attribuutit: nimet, luokat, alueet, segmentit — pääosin tekstiä;
  • Pääavain: yksilöllinen ID-sarake, johon faktataulu viittaa.

Esimerkkejä dimensiotauluista:

  • Customers (CustomerID, CustomerName, Region, Segment);
  • Products (ProductID, ProductName, Category, UnitPrice);
  • Dates (Date, Year, Month, Quarter);
  • Employees (EmployeeID, Name, Department, Role).

Kolmen kysymyksen päätösmalli

Jokaisen sarakkeen kohdalla tasaisessa taulussa kysy nämä kysymykset järjestyksessä:

K1: Mittaako tämä sarake jotakin, jonka haluat laskea yhteen tai laskea? — Määrä, Yhteensä, Kustannus → faktataulun mittari;

K2: Onko tämä sarake ID, joka linkittää kuvaukseen muualla? — CustomerID, ProductID, OrderDate → faktataulun vierasavain;

K3: Onko tämä kuvaileva nimike henkilöstä, tuotteesta tai ajanjaksosta? — CustomerName, Region, Category → dimensiotaulun attribuutti.

Jos sarake kuuluu K3:een, kysy vielä yksi: mitä aihetta se kuvaa? Kaikki asiakkaisiin liittyvät sarakkeet kuuluvat Customers-tauluun. Kaikki tuotteisiin liittyvät sarakkeet kuuluvat Products-tauluun. Päivämääriä kuvaavat sarakkeet kuuluvat Dates-tauluun.

1. Taulukossa Orders_Flat mikä seuraavista sarakeryhmistä kuuluu selkeimmin yhteen Products -dimensioon?

2. Mikä seuraavista väittämistä kuvaa parhaiten tämän luvun Sales-faktataulun grainin?

question mark

Taulukossa Orders_Flat mikä seuraavista sarakeryhmistä kuuluu selkeimmin yhteen Products -dimensioon?

Valitse oikea vastaus

question mark

Mikä seuraavista väittämistä kuvaa parhaiten tämän luvun Sales-faktataulun grainin?

Valitse oikea vastaus

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 2

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 2. Luku 2
some-alt