Nächste Schritte in der Sicherheit
Swipe um das Menü anzuzeigen
Unity Catalog ist die einheitliche Governance-Schicht für alle Daten- und KI-Assets in Databricks. Sie bietet eine zentrale Stelle zur Verwaltung von Berechtigungen, zur Nachverfolgung der Datenherkunft und zur Gewährleistung eines sicheren Zugriffs über verschiedene Workspaces und Cloud-Umgebungen hinweg.
Mit zunehmender Vertrautheit mit der diamonds-Tabelle unter workspace.workshop.diamonds ist es wichtig zu verstehen, wie der Zugriff auf diese Daten gesteuert wird. In einer professionellen Umgebung kann nicht jeder Benutzer Tabellen nach Belieben löschen oder aktualisieren.
Hier kommt der Unity Catalog ins Spiel – er fungiert als „Sicherheitsdienst“ für das gesamte Lakehouse.
1. Zentralisierte Zugriffskontrolle
Vor Unity Catalog war es in großen Unternehmen schwierig zu verwalten, wer welche Tabelle sehen durfte. Jetzt wird dies an einer zentralen Stelle geregelt.
- Berechtigungen: Administratoren können spezifische Rechte wie
SELECT(nur Lesen),MODIFY(kann aktualisieren/löschen) oderCREATEvergeben; - Das „Owner“-Konzept: Jede Tabelle hat einen Besitzer (in der Regel die Person, die sie erstellt hat), der entscheidet, wer sonst noch mit diesen Daten interagieren darf.
2. Der dreiteilige Namensraum
Unity Catalog erzwingt den in diesem Kurs verwendeten Namensstandard: Catalog > Schema > Table.
- Catalog: Übergeordneter Container (z. B.
workspace); - Schema: Ordnerähnliche Gruppierung (z. B.
workshop); - Table: Einzelner Datensatz (z. B.
diamonds).
Diese Struktur erleichtert die Organisation von Daten nach Abteilung (z. B. Finance.Quarterly_Reports.Revenue) und sorgt für konsistente Sicherheitsregeln auf jeder Ebene.
3. Datenherkunft (Data Lineage)
Eine der leistungsstärksten Funktionen des Unity Catalog ist die Datenherkunft (Lineage).
- Im Catalog Explorer kann die Tabelle diamonds ausgewählt werden, um eine visuelle Darstellung der Herkunft der Daten und der aktuell verwendenden Notebooks zu sehen
- Bei einer Änderung eines Spaltennamens in der Quelle zeigt Lineage genau an, welche nachgelagerten Berichte betroffen sind — unbeabsichtigte "Breaking Changes" werden so verhindert
4. Suche und Auffindbarkeit
Unity Catalog macht Daten auffindbar. Anstatt einen Kollegen nach einer bestimmten Datei zu fragen, kann die Suchleiste oben in der Databricks-Oberfläche verwendet werden.
Da die Daten im Catalog registriert sind, kann nach "diamonds" gesucht werden, um sofort die Tabelle, ihr Schema und alle vom Eigentümer bereitgestellten Dokumentationen zu finden.
5. Prüfprotokolle
Sicherheit bedeutet auch Nachvollziehbarkeit. Unity Catalog führt ein Protokoll darüber, wer auf welche Daten und wann zugegriffen hat.
Dies ist für Unternehmen in regulierten Branchen – wie Finanzwesen oder Gesundheitswesen – unerlässlich, um nachzuweisen, dass sensible Daten korrekt behandelt werden und keine unbefugten Benutzer auf vertrauliche Informationen zugreifen.
1. Was ist der Hauptzweck des Unity Catalog in Databricks?
2. Was stellt "workshop" im dreiteiligen Namensraum (z. B. workspace.workshop.diamonds) dar?
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen