Próximos Passos em Segurança
Deslize para mostrar o menu
Unity Catalog é a camada unificada de governança para todos os ativos de dados e IA no Databricks. Oferece um local centralizado para gerenciar permissões, rastrear a linhagem dos dados e garantir acesso seguro entre diferentes workspaces e ambientes em nuvem.
À medida que você se familiariza com a tabela diamonds em workspace.workshop.diamonds, é importante entender como o acesso a esses dados é controlado. Em um ambiente profissional, não é permitido que qualquer usuário exclua ou atualize tabelas livremente.
É aqui que o Unity Catalog entra — ele atua como o "Guarda de Segurança" de todo o seu Lakehouse.
1. Controle Centralizado de Acesso
Antes do Unity Catalog, gerenciar quem podia visualizar cada tabela era uma tarefa difícil em grandes empresas. Agora, isso é feito em um único local centralizado.
- Privilégios: administradores podem conceder permissões específicas como
SELECT(somente leitura),MODIFY(pode atualizar/excluir) ouCREATE; - O conceito de "Owner": toda tabela possui um proprietário (geralmente quem a criou) que decide quem mais pode interagir com esses dados.
2. O Namespace em Três Partes
O Unity Catalog aplica o padrão de nomenclatura utilizado ao longo deste curso: Catálogo > Esquema > Tabela.
- Catálogo: contêiner de alto nível (por exemplo,
workspace); - Esquema: agrupamento semelhante a uma pasta (por exemplo,
workshop); - Tabela: conjunto de dados individual (por exemplo,
diamonds).
Essa estrutura facilita a organização dos dados por departamento (por exemplo, Finance.Quarterly_Reports.Revenue), mantendo regras de segurança consistentes em todos os níveis.
3. Linhagem de Dados
Um dos recursos mais poderosos do Unity Catalog é a Linhagem.
- No Catalog Explorer, é possível clicar na tabela diamonds e visualizar um mapa visual de onde esses dados se originaram e quais notebooks estão utilizando-os atualmente
- Se um nome de coluna for alterado na fonte, a Linhagem informa exatamente quais relatórios a jusante serão afetados — evitando alterações "quebradas" não intencionais
4. Pesquisa e Descoberta
O Unity Catalog torna os dados descobertos. Em vez de perguntar a um colega onde está um arquivo específico, é possível utilizar a barra de pesquisa no topo da interface do Databricks.
Como os dados estão registrados no Catálogo, é possível pesquisar por "diamonds" e encontrar instantaneamente a tabela, seu esquema e qualquer documentação fornecida pelo proprietário.
5. Logs de Auditoria
Segurança também significa responsabilidade. O Unity Catalog mantém um registro de quem acessou quais dados e quando.
Isso é essencial para empresas em setores regulamentados — como finanças ou saúde — para comprovar que dados sensíveis estão sendo tratados corretamente e que nenhum usuário não autorizado está consultando informações privadas.
1. Qual é o principal objetivo do Unity Catalog no Databricks?
2. No namespace de três partes (por exemplo, workspace.workshop.diamonds), o que "workshop" representa?
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo