Tasaisen Datan Uudelleenjärjestely Relaatiotauluiksi
Pyyhkäise näyttääksesi valikon
Laaja tasainen taulukko on yksittäinen taulukko, joka sisältää kaikki tiedot jokaisesta tapahtumasta — asiakastiedot, tuotetiedot, päivämäärät ja tapahtuma-arvot ovat kaikki samassa paikassa. Se on helppolukuinen, mutta ei sovellu relaatiotietomallin pohjaksi.
Toistamisen ongelma: jokainen Acme Corpille tehty tilaus toistaa asiakasnimen, alueen ja segmentin. Jos nämä tiedot muuttuvat, jokainen rivi on päivitettävä erikseen — mikä johtaa epäjohdonmukaisuuksiin ja turhaan tallennustilan kulutukseen.
Videolla käytetty työkirja on eri kuin tehtävässä käytetty työkirja. Jos haluat seurata opettajan vaiheita tunnin aikana, lataa videon alla oleva työkirja ennen aloittamista.
Vaihe 1 — Tunnista ja erottele dimensio-taulut
Dimensio-taulut kuvaavat kunkin tapahtuman kuka, mitä ja milloin -tietoja. Aloita näistä, koska niiden rajat ovat yleensä selkeimmät. Jokaisen rivin tulee olla yksilöllinen — poista kaksoiskappaleet liittämisen jälkeen.
- Customers -taulu: CustomerID (PK), CustomerName, Region, Segment;
- Products -taulu: ProductID (PK), ProductName, Category;
- Dates -taulu: Date (PK), Year, Month (number), Month name, Quarter.
Miksi päivämäärätaulun tulee kattaa koko vuosi?
Aikaan perustuvat laskelmat (vuositasolla, liukuvat keskiarvot, jaksovertailut) vaativat jatkuvan, aukottoman kalenterin. Jos taulussa on vain tilauspäiviä, kuukaudet ilman myyntiä puuttuvat kokonaan ja laskelmat eivät toimi.
Vaihe 2 — Rakenna faktataulu
Faktataulu tallentaa tapahtumat — yksi rivi per tapahtuma. Se sisältää mitattavat arvot ja vierasavaimet, jotka yhdistävät tapahtuman dimensio-tauluihin. Taulu ei sisällä kuvailevaa tekstiä.
- Sales (faktataulu): OrderID (PK), OrderDate → Dates (FK), CustomerID → Customers (FK), ProductID → Products (FK), UnitPrice, Quantity, Total.
- PK — Primary Key (yksilöllinen tunniste jokaiselle tietueelle taulussa);
- FK — Foreign Key (kenttä, joka viittaa toisen taulun Primary Key -kenttään).
Tähtimalli
Neljän taulun kokonaisuus muodostaa tähtimallin: faktataulu sijaitsee keskellä ja ulottuvuustaulut säteilevät ulospäin, jokainen yhdistettynä ensisijaisen avaimen ja viiteavaimen parilla.
Tehtävä
- Väritä leveän tasaisen taulukon sarakkeet kohteen mukaan: asiakkaat (sininen), tuotteet (oranssi), päivämäärät (vihreä), faktatiedot (keltainen);
- Kopioi jokainen väriryhmä uudelle välilehdelle. Muunna alue nimetyksi Excel-taulukoksi (Lisää → Taulukko);
- Valitse ensisijainen avainsarake ja käytä Tiedot → Poista kaksoiskappaleet varmistaaksesi, että jokainen rivi on yksilöllinen.
- Päivämäärätaulukossa laajenna päivämääräsarake kattamaan jokainen päivä 1. tammikuuta – 31. joulukuuta, ja lisää sitten Vuosi, Kuukausi, Kuukauden nimi ja Vuosineljännes -sarakkeet käyttämällä
=YEAR(),=MONTH(),=TEXT(B2, "MMMM")ja vuosineljänneskaavaa="Q"&INT((MONTH(B2)-1)/3+1). - Liitä päivämäärätaulukko vain arvoina (ilman kaavoja) puhtaalle välilehdelle ennen taulukoksi muuntamista.
- Rakenna faktataulukko jäljelle jäävistä sarakkeista sekä kolmesta viiteavaimesta (
OrderDate,CustomerID,ProductID).
1. Mitkä ovat tärkeimmät hyödyt, kun tasainen taulukko refaktoroidaan faktatauluksi ja dimensioiksi? (Valitse kaksi)
2. Kun luodaan Customers-dimensio tasaisesta taulukosta, mikä vaihe on oleellinen?
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme