Næste Skridt Inden for Sikkerhed
Stryg for at vise menuen
Unity Catalog er det samlede styringslag for alle data- og AI-aktiver i Databricks. Det giver ét samlet sted til at administrere tilladelser, spore datalinjer og sikre sikker adgang på tværs af forskellige arbejdsområder og cloud-miljøer.
Når du bliver mere fortrolig med diamonds-tabellen i workspace.workshop.diamonds, er det vigtigt at forstå, hvordan adgangen til disse data styres. I et professionelt miljø kan man ikke tillade, at enhver bruger sletter eller opdaterer tabeller efter forgodtbefindende.
Her kommer Unity Catalog ind i billedet — det fungerer som "sikkerhedsvagten" for hele din Lakehouse.
1. Centraliseret adgangskontrol
Før Unity Catalog var det svært at styre, hvem der kunne se hvilke tabeller i store virksomheder. Nu håndteres det ét centralt sted.
- Privilegier: administratorer kan tildele specifikke tilladelser som
SELECT(kun læseadgang),MODIFY(kan opdatere/slette) ellerCREATE; - "Ejer"-konceptet: hver tabel har en ejer (typisk den person, der har oprettet den), som bestemmer, hvem der ellers må interagere med disse data.
2. Det tre-delte navnerum
Unity Catalog håndhæver den navngivningsstandard, der bruges gennem hele dette kursus: Catalog > Schema > Table.
- Catalog: et overordnet container (f.eks.
workspace); - Schema: en mappe-lignende gruppering (f.eks.
workshop); - Table: det individuelle datasæt (f.eks.
diamonds).
Denne struktur gør det nemt at organisere data efter afdeling (f.eks. Finance.Quarterly_Reports.Revenue), samtidig med at sikkerhedsreglerne forbliver ensartede på alle niveauer.
3. Data lineage
En af de mest kraftfulde funktioner i Unity Catalog er Lineage.
- I Catalog Explorer kan du klikke på din diamonds-tabel og se et visuelt kort over, hvor dataene stammer fra, og hvilke notebooks der aktuelt bruger dem
- Hvis du ændrer et kolonnenavn i kilden, fortæller Lineage dig præcis, hvilke nedstrøms rapporter der bliver påvirket — hvilket forhindrer utilsigtede "breaking" ændringer
4. Søgning og opdagelse
Unity Catalog gør data opdagelige. I stedet for at spørge en kollega, hvor en bestemt fil ligger, kan du bruge søgefeltet øverst i Databricks UI.
Fordi dataene er registreret i Catalog, kan du søge efter "diamonds" og straks finde tabellen, dens schema og eventuel dokumentation fra ejeren.
5. Revisionslogfiler
Sikkerhed indebærer også ansvarlighed. Unity Catalog fører en log over hvem der har tilgået hvilke data og hvornår.
Dette er essentielt for virksomheder i regulerede brancher — såsom finans eller sundhedsvæsen — for at kunne dokumentere, at følsomme data håndteres korrekt, og at ingen uautoriserede brugere forespørger på private oplysninger.
1. Hvad er det primære formål med Unity Catalog i Databricks?
2. I det tre-delte navnerum (f.eks. workspace.workshop.diamonds), hvad repræsenterer "workshop"?
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat