Seuraavat Vaiheet Tietoturvassa
Pyyhkäise näyttääksesi valikon
Unity Catalog on yhtenäinen hallintakerros kaikille Databricksin data- ja tekoälyvaroille. Se tarjoaa yhden paikan käyttöoikeuksien hallintaan, tietojen alkuperän seurantaan ja turvallisen pääsyn varmistamiseen eri työtilojen ja pilviympäristöjen välillä.
Kun tulet tutummaksi diamonds-taulun kanssa osoitteessa workspace.workshop.diamonds, on tärkeää ymmärtää, miten pääsy kyseisiin tietoihin on hallittu. Ammatillisessa ympäristössä ei ole mahdollista, että jokainen käyttäjä voi poistaa tai päivittää tauluja vapaasti.
Tässä kohtaa Unity Catalog astuu kuvaan — se toimii koko Lakehouse-ympäristön "turvamiehenä".
1. Keskitetty käyttöoikeuksien hallinta
Ennen Unity Catalogia oli haastavaa hallita, kuka näkee minkäkin taulun suurissa organisaatioissa. Nyt tämä hoidetaan yhdessä keskitetysti.
- Oikeudet: ylläpitäjät voivat myöntää erityisiä käyttöoikeuksia, kuten
SELECT(vain luku),MODIFY(voi päivittää/poistaa) taiCREATE; - "Omistaja"-käsite: jokaisella taululla on omistaja (yleensä sen luonut henkilö), joka päättää, kenellä muulla on oikeus käsitellä kyseistä dataa.
2. Kolmiosainen nimiavaruus
Unity Catalog noudattaa tässä kurssissa käytettyä nimeämisstandardia: Catalog > Schema > Table.
- Catalog: korkean tason säiliö (esim.
workspace); - Schema: kansiomainen ryhmittely (esim.
workshop); - Table: yksittäinen tietoaineisto (esim.
diamonds).
Tämä rakenne helpottaa datan järjestämistä esimerkiksi osastoittain (esim. Finance.Quarterly_Reports.Revenue) ja mahdollistaa yhtenäiset suojaussäännöt kaikilla tasoilla.
3. Datan alkuperän jäljitys
Yksi Unity Catalogin tehokkaimmista ominaisuuksista on Lineage.
- Catalog Explorerissa voit klikata diamonds-taulua ja nähdä visuaalisen kartan siitä, mistä data on peräisin ja mitkä notebookit käyttävät sitä tällä hetkellä
- Jos muutat sarakkeen nimeä lähteessä, Lineage kertoo tarkalleen, mitkä alaspäin suuntautuvat raportit vaikuttuvat muutoksesta — näin vältetään tahattomat "rikki menevät" muutokset
4. Haku ja löydettävyys
Unity Catalog tekee datasta löydettävää. Sen sijaan, että kysyisit kollegalta tietyn tiedoston sijaintia, voit käyttää Databricksin käyttöliittymän yläreunan hakupalkkia.
Koska data on rekisteröity Catalogiin, voit hakea esimerkiksi "diamonds" ja löytää välittömästi taulun, sen skeeman ja mahdollisen omistajan lisäämän dokumentaation.
5. Audit-lokit
Tietoturva tarkoittaa myös vastuullisuutta. Unity Catalog tallentaa tiedot siitä, kuka on käyttänyt mitäkin dataa ja milloin.
Tämä on olennaista säännellyillä toimialoilla — kuten rahoitus- tai terveysalalla — jotta voidaan osoittaa, että arkaluonteisia tietoja käsitellään asianmukaisesti eikä luvattomat käyttäjät pääse käsiksi yksityisiin tietoihin.
1. Mikä on Unity Catalogin ensisijainen tarkoitus Databricksissa?
2. Kolmiosaisessa nimiavaruudessa (esim. workspace.workshop.diamonds), mitä "workshop" edustaa?
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme