Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Наступні Кроки у Сфері Безпеки | Основні Концепції Databricks
Databricks: Основи для Початківців

Наступні Кроки у Сфері Безпеки

Свайпніть щоб показати меню

Note
Визначення

Unity Catalog — це уніфікований рівень управління для всіх даних та AI-активів у Databricks. Забезпечує єдине місце для керування дозволами, відстеження походження даних і гарантує безпечний доступ у різних робочих просторах та хмарних середовищах.

Коли ви краще ознайомитесь із таблицею diamonds у workspace.workshop.diamonds, важливо зрозуміти, як контролюється доступ до цих даних. У професійному середовищі не можна дозволяти кожному користувачу видаляти чи змінювати таблиці без обмежень.

Саме тут на допомогу приходить Unity Catalog — він виконує роль "Охоронця безпеки" для всієї вашої Lakehouse-платформи.

1. Централізований контроль доступу

До появи Unity Catalog керування тим, хто може бачити певну таблицю, було складним у великих компаніях. Тепер це здійснюється в одному центральному місці.

  • Привілеї: адміністратори можуть надавати конкретні дозволи, такі як SELECT (тільки читання), MODIFY (можна оновлювати/видаляти) або CREATE;
  • Концепція "Власника": кожна таблиця має власника (зазвичай це особа, яка її створила), який визначає, хто ще може взаємодіяти з цими даними.

2. Трирівнева система іменування

Unity Catalog впроваджує стандарт іменування, який використовується протягом цього курсу: Catalog > Schema > Table.

  • Catalog: контейнер верхнього рівня (наприклад, workspace);
  • Schema: групування, подібне до папки (наприклад, workshop);
  • Table: окремий набір даних (наприклад, diamonds).

Ця структура спрощує організацію даних за відділами (наприклад, Finance.Quarterly_Reports.Revenue), забезпечуючи послідовність правил безпеки на кожному рівні.

3. Походження даних

Однією з найпотужніших функцій Unity Catalog є Lineage (походження даних).

  • У Catalog Explorer можна натиснути на таблицю diamonds і побачити візуальну карту джерел даних та тих ноутбуків, які наразі її використовують
  • Якщо змінити назву стовпця у джерелі, Lineage точно покаже, які звіти нижчого рівня будуть впливати — це допомагає уникнути небажаних "зламаних" змін

4. Пошук і виявлення

Unity Catalog робить дані доступними для пошуку. Замість того, щоб питати колегу про розташування певного файлу, можна скористатися рядком пошуку у верхній частині інтерфейсу Databricks.

Оскільки дані зареєстровані в Catalog, можна шукати "diamonds" і миттєво знаходити таблицю, її схему та будь-яку документацію, надану власником.

5. Журнали аудиту

Безпека також означає підзвітність. Unity Catalog веде запис хто отримував доступ до яких даних і коли.

Це важливо для компаній у регульованих галузях — таких як фінанси чи охорона здоров'я — щоб довести, що конфіденційні дані обробляються належним чином і що неавторизовані користувачі не виконують запити до приватної інформації.

1. Яке основне призначення Unity Catalog у Databricks?

2. У тричастинному іменному просторі (наприклад, workspace.workshop.diamonds), що означає "workshop"?

question mark

Яке основне призначення Unity Catalog у Databricks?

Виберіть правильну відповідь

question mark

У тричастинному іменному просторі (наприклад, workspace.workshop.diamonds), що означає "workshop"?

Виберіть правильну відповідь

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 5. Розділ 5

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Секція 5. Розділ 5
some-alt