Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Nächste Schritte in der Sicherheit | Kernkonzepte von Databricks
Databricks-Grundlagen: Ein Leitfaden für Einsteiger

Nächste Schritte in der Sicherheit

Swipe um das Menü anzuzeigen

Note
Definition

Unity Catalog ist die einheitliche Governance-Schicht für alle Daten- und KI-Assets in Databricks. Sie bietet eine zentrale Stelle zur Verwaltung von Berechtigungen, zur Nachverfolgung der Datenherkunft und zur Gewährleistung eines sicheren Zugriffs über verschiedene Workspaces und Cloud-Umgebungen hinweg.

Mit zunehmender Vertrautheit mit der diamonds-Tabelle unter workspace.workshop.diamonds ist es wichtig zu verstehen, wie der Zugriff auf diese Daten gesteuert wird. In einer professionellen Umgebung kann nicht jeder Benutzer Tabellen nach Belieben löschen oder aktualisieren.

Hier kommt der Unity Catalog ins Spiel – er fungiert als „Sicherheitsdienst“ für das gesamte Lakehouse.

1. Zentralisierte Zugriffskontrolle

Vor Unity Catalog war es in großen Unternehmen schwierig zu verwalten, wer welche Tabelle sehen durfte. Jetzt wird dies an einer zentralen Stelle geregelt.

  • Berechtigungen: Administratoren können spezifische Rechte wie SELECT (nur Lesen), MODIFY (kann aktualisieren/löschen) oder CREATE vergeben;
  • Das „Owner“-Konzept: Jede Tabelle hat einen Besitzer (in der Regel die Person, die sie erstellt hat), der entscheidet, wer sonst noch mit diesen Daten interagieren darf.

2. Der dreiteilige Namensraum

Unity Catalog erzwingt den in diesem Kurs verwendeten Namensstandard: Catalog > Schema > Table.

  • Catalog: Übergeordneter Container (z. B. workspace);
  • Schema: Ordnerähnliche Gruppierung (z. B. workshop);
  • Table: Einzelner Datensatz (z. B. diamonds).

Diese Struktur erleichtert die Organisation von Daten nach Abteilung (z. B. Finance.Quarterly_Reports.Revenue) und sorgt für konsistente Sicherheitsregeln auf jeder Ebene.

3. Datenherkunft (Data Lineage)

Eine der leistungsstärksten Funktionen des Unity Catalog ist die Datenherkunft (Lineage).

  • Im Catalog Explorer kann die Tabelle diamonds ausgewählt werden, um eine visuelle Darstellung der Herkunft der Daten und der aktuell verwendenden Notebooks zu sehen
  • Bei einer Änderung eines Spaltennamens in der Quelle zeigt Lineage genau an, welche nachgelagerten Berichte betroffen sind — unbeabsichtigte "Breaking Changes" werden so verhindert

4. Suche und Auffindbarkeit

Unity Catalog macht Daten auffindbar. Anstatt einen Kollegen nach einer bestimmten Datei zu fragen, kann die Suchleiste oben in der Databricks-Oberfläche verwendet werden.

Da die Daten im Catalog registriert sind, kann nach "diamonds" gesucht werden, um sofort die Tabelle, ihr Schema und alle vom Eigentümer bereitgestellten Dokumentationen zu finden.

5. Prüfprotokolle

Sicherheit bedeutet auch Nachvollziehbarkeit. Unity Catalog führt ein Protokoll darüber, wer auf welche Daten und wann zugegriffen hat.

Dies ist für Unternehmen in regulierten Branchen – wie Finanzwesen oder Gesundheitswesen – unerlässlich, um nachzuweisen, dass sensible Daten korrekt behandelt werden und keine unbefugten Benutzer auf vertrauliche Informationen zugreifen.

1. Was ist der Hauptzweck des Unity Catalog in Databricks?

2. Was stellt "workshop" im dreiteiligen Namensraum (z. B. workspace.workshop.diamonds) dar?

question mark

Was ist der Hauptzweck des Unity Catalog in Databricks?

Wählen Sie die richtige Antwort aus

question mark

Was stellt "workshop" im dreiteiligen Namensraum (z. B. workspace.workshop.diamonds) dar?

Wählen Sie die richtige Antwort aus

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 5. Kapitel 5

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Abschnitt 5. Kapitel 5
some-alt