Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Próximos Passos em Segurança | Conceitos Fundamentais do Databricks
Fundamentos do Databricks: Um Guia para Iniciantes

Próximos Passos em Segurança

Deslize para mostrar o menu

Note
Definição

Unity Catalog é a camada unificada de governança para todos os ativos de dados e IA no Databricks. Oferece um local centralizado para gerenciar permissões, rastrear a linhagem dos dados e garantir acesso seguro entre diferentes workspaces e ambientes em nuvem.

À medida que você se familiariza com a tabela diamonds em workspace.workshop.diamonds, é importante entender como o acesso a esses dados é controlado. Em um ambiente profissional, não é permitido que qualquer usuário exclua ou atualize tabelas livremente.

É aqui que o Unity Catalog entra — ele atua como o "Guarda de Segurança" de todo o seu Lakehouse.

1. Controle Centralizado de Acesso

Antes do Unity Catalog, gerenciar quem podia visualizar cada tabela era uma tarefa difícil em grandes empresas. Agora, isso é feito em um único local centralizado.

  • Privilégios: administradores podem conceder permissões específicas como SELECT (somente leitura), MODIFY (pode atualizar/excluir) ou CREATE;
  • O conceito de "Owner": toda tabela possui um proprietário (geralmente quem a criou) que decide quem mais pode interagir com esses dados.

2. O Namespace em Três Partes

O Unity Catalog aplica o padrão de nomenclatura utilizado ao longo deste curso: Catálogo > Esquema > Tabela.

  • Catálogo: contêiner de alto nível (por exemplo, workspace);
  • Esquema: agrupamento semelhante a uma pasta (por exemplo, workshop);
  • Tabela: conjunto de dados individual (por exemplo, diamonds).

Essa estrutura facilita a organização dos dados por departamento (por exemplo, Finance.Quarterly_Reports.Revenue), mantendo regras de segurança consistentes em todos os níveis.

3. Linhagem de Dados

Um dos recursos mais poderosos do Unity Catalog é a Linhagem.

  • No Catalog Explorer, é possível clicar na tabela diamonds e visualizar um mapa visual de onde esses dados se originaram e quais notebooks estão utilizando-os atualmente
  • Se um nome de coluna for alterado na fonte, a Linhagem informa exatamente quais relatórios a jusante serão afetados — evitando alterações "quebradas" não intencionais

4. Pesquisa e Descoberta

O Unity Catalog torna os dados descobertos. Em vez de perguntar a um colega onde está um arquivo específico, é possível utilizar a barra de pesquisa no topo da interface do Databricks.

Como os dados estão registrados no Catálogo, é possível pesquisar por "diamonds" e encontrar instantaneamente a tabela, seu esquema e qualquer documentação fornecida pelo proprietário.

5. Logs de Auditoria

Segurança também significa responsabilidade. O Unity Catalog mantém um registro de quem acessou quais dados e quando.

Isso é essencial para empresas em setores regulamentados — como finanças ou saúde — para comprovar que dados sensíveis estão sendo tratados corretamente e que nenhum usuário não autorizado está consultando informações privadas.

1. Qual é o principal objetivo do Unity Catalog no Databricks?

2. No namespace de três partes (por exemplo, workspace.workshop.diamonds), o que "workshop" representa?

question mark

Qual é o principal objetivo do Unity Catalog no Databricks?

Selecione a resposta correta

question mark

No namespace de três partes (por exemplo, workspace.workshop.diamonds), o que "workshop" representa?

Selecione a resposta correta

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 5. Capítulo 5

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 5. Capítulo 5
some-alt