Prossimi Passi nella Sicurezza
Scorri per mostrare il menu
Unity Catalog è il livello unificato di governance per tutti i dati e le risorse di intelligenza artificiale in Databricks. Fornisce un unico punto per gestire le autorizzazioni, tracciare la provenienza dei dati e garantire un accesso sicuro tra diversi workspace e ambienti cloud.
Man mano che acquisisci familiarità con la tabella diamonds in workspace.workshop.diamonds, è importante comprendere come viene controllato l'accesso a questi dati. In un ambiente professionale, non è possibile permettere a ogni utente di eliminare o aggiornare le tabelle liberamente.
Qui entra in gioco Unity Catalog — agisce come la "guardia di sicurezza" per l'intero Lakehouse.
1. Controllo centralizzato degli accessi
Prima di Unity Catalog, gestire chi poteva vedere quale tabella era complesso nelle grandi aziende. Ora, tutto viene gestito in un unico punto centrale.
- Privilegi: gli amministratori possono concedere permessi specifici come
SELECT(sola lettura),MODIFY(può aggiornare/eliminare) oCREATE; - Il concetto di "Owner": ogni tabella ha un proprietario (di solito chi l'ha creata) che decide chi può interagire con quei dati.
2. Il namespace a tre livelli
Unity Catalog applica lo standard di denominazione utilizzato in tutto questo corso: Catalogo > Schema > Tabella.
- Catalogo: contenitore di alto livello (ad esempio,
workspace); - Schema: raggruppamento simile a una cartella (ad esempio,
workshop); - Tabella: dataset individuale (ad esempio,
diamonds).
Questa struttura facilita l'organizzazione dei dati per dipartimento (ad esempio, Finance.Quarterly_Reports.Revenue), mantenendo regole di sicurezza coerenti a ogni livello.
3. Lineage dei dati
Una delle funzionalità più potenti di Unity Catalog è la Lineage.
- Nel Catalog Explorer, è possibile cliccare sulla tabella diamonds e visualizzare una mappa visiva dell'origine dei dati e dei notebook che la stanno utilizzando
- Se si modifica il nome di una colonna nella sorgente, Lineage indica esattamente quali report a valle saranno interessati, prevenendo modifiche "breaking" indesiderate
4. Ricerca e scoperta
Unity Catalog rende i dati scopribili. Invece di chiedere a un collega dove si trova un file specifico, è possibile utilizzare la barra di ricerca nella parte superiore dell'interfaccia Databricks.
Poiché i dati sono registrati nel Catalog, è possibile cercare "diamonds" e trovare immediatamente la tabella, il relativo schema e qualsiasi documentazione fornita dal proprietario.
5. Log di audit
La sicurezza implica anche responsabilità. Unity Catalog mantiene una registrazione di chi ha avuto accesso a quali dati e quando.
Questo è essenziale per le aziende in settori regolamentati — come finanza o sanità — per dimostrare che i dati sensibili vengono gestiti correttamente e che nessun utente non autorizzato sta interrogando informazioni private.
1. Qual è lo scopo principale di Unity Catalog in Databricks?
2. Nel namespace a tre parti (ad es., workspace.workshop.diamonds), cosa rappresenta "workshop"?
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione