Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Керування Кластерами | Налаштування Робочого Простору
Databricks: Основи для Початківців

Керування Кластерами

Свайпніть щоб показати меню

Note
Визначення

Управління кластерами — це процес контролю життєвого циклу обчислювальних ресурсів. Знання, коли запускати, зупиняти та перезапускати кластер, є важливим для керування продуктивністю та контролю витрат у хмарі.

Тепер, коли ви знаєте, як створити кластер, потрібно навчитися ним керувати. У хмарі оплата здійснюється за кожну секунду, коли кластер перебуває у стані "Running". Бути професійним дата-інженером або аналітиком означає не лише вміти писати код, а й ефективно керувати ресурсами, щоб не витрачати бюджет компанії чи власний.

Розуміння статусів кластера

Коли ви переглядаєте сторінку Compute, поруч із назвою вашого кластера відображаються різні іконки статусу. Розуміння цих іконок допомагає визначити, чи можна запускати код:

  • Running (зелений круг): рушій активний і готовий до роботи. Можливий миттєвий запуск ноутбуків і запитів;
  • Terminated (сірий круг): рушій вимкнений. Вартість $0, але запуск коду неможливий, поки кластер не буде знову запущено;
  • Pending (обертовий круг): кластер "розігрівається". Хмарний провайдер наразі виділяє для вас апаратні ресурси;
  • Restarting: кластер вимикається і одразу запускається знову, що корисно при зміні налаштувань конфігурації.

Ручне керування: запуск, зупинка та перезапуск

Праворуч від вашого кластера у списку відображаються декілька іконок дій:

  • Кнопка Play (Запуск): використовуйте її на початку робочого дня. Перехід із "Terminated" до "Running" займає приблизно 3–5 хвилин;
  • Кнопка Square (Завершити/Зупинити): натискайте її одразу після завершення роботи. Це миттєво зупиняє нарахування вартості. Важливо: завершення роботи кластера не видаляє ваші дані чи ноутбуки; це лише вимикає "рушій" і очищає пам'ять (змінні, що зберігалися в пам'яті, будуть видалені, як і при вимкненні власного комп'ютера).
  • Кругова стрілка (Перезапуск): якщо кластер працює повільно або ви встановили нову бібліотеку, яка потребує оновлення, скористайтеся кнопкою Перезапуск.

Редагування vs. Клонування

Іноді ви розумієте, що створений вами "двигун" не зовсім підходить.

  • Редагування: можна змінити розмір кластера або версію середовища виконання, натиснувши на назву та вибравши "Редагувати". Зверніть увагу, що зазвичай потрібно завершити роботу кластера, перш ніж зберегти зміни до його апаратного забезпечення;
  • Клонування: якщо поточна конфігурація вас влаштовує, але потрібен другий, ідентичний кластер (наприклад, для іншого проєкту), кнопка "Клонувати" дозволяє швидко створити копію без повторного введення всіх налаштувань.

Золоте правило економії коштів

Найдорожчий кластер — це той, який "Працює", але абсолютно нічого не виконує. Завжди звіряйте вкладку Compute перед виходом із системи наприкінці дня. Якщо бачите зелене світло і більше не запускаєте код, натисніть кнопку Square (Stop). У світі Big Data "Зупинити" так само важливо, як і "Запустити".

1. Чи видаляє "Завершення" кластера написані вами блокноти?

2. Який статус вказує на те, що кластер наразі розігрівається і ще не готовий до виконання коду?

3. Ви завершили аналіз на сьогодні. Яка найкраща практика, щоб уникнути зайвих витрат на хмару протягом ночі?

question mark

Чи видаляє "Завершення" кластера написані вами блокноти?

Виберіть правильну відповідь

question mark

Який статус вказує на те, що кластер наразі розігрівається і ще не готовий до виконання коду?

Виберіть правильну відповідь

question mark

Ви завершили аналіз на сьогодні. Яка найкраща практика, щоб уникнути зайвих витрат на хмару протягом ночі?

Виберіть правильну відповідь

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 4

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Секція 2. Розділ 4
some-alt