Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Написання та Виконання SQL-Коду | Досвід роботи з ноутбуком
Databricks: Основи для Початківців

Написання та Виконання SQL-Коду

Свайпніть щоб показати меню

Note
Визначення

SQL (Structured Query Language) — це стандартна мова для взаємодії з реляційними базами даних. У Databricks SQL використовується для запитів до таблиць у Lakehouse, створення візуалізацій та виконання аналізу даних у блокнотах.

Хоча Python є потужним інструментом для інженерії даних, SQL залишається найпопулярнішою мовою для аналізу даних. Databricks розглядає SQL як повноцінну мову. Навіть якщо мова за замовчуванням у вашому блокноті — Python, ви можете легко переключитися на SQL для швидкого перегляду даних або виконання складних об'єднань.

Використання SQL у SQL-блокноті

Якщо ви створили блокнот із SQL як мовою за замовчуванням, кожна нова клітинка автоматично буде SQL-клітинкою. Просто введіть свій запит — наприклад, SELECT * FROM table_name — і виконайте його. Результат відобразиться у зручному інтерактивному табличному форматі, де можна сортувати стовпці або шукати конкретні значення без написання додаткового коду.

"Магічна" команда: %sql

Якщо ви працюєте у Python-ноутбуці, немає потреби створювати окремий файл лише для виконання SQL-запиту. Databricks використовує "магічні команди" для миттєвого перемикання між мовами. Ввівши %sql на самому початку комірки, ви вказуєте кластеру ігнорувати Python і виконати цю конкретну комірку як SQL-код.

%sql
SELECT "Hello from the SQL engine" AS message

Запити до зразкових даних

У розділі 2 ми завантажили файл під назвою diamonds. Тепер ми можемо виконувати до нього запити безпосередньо. У SQL-комірці спробуйте наступний код:

SELECT 
  carat, 
  cut, 
  price 
FROM 
  workspace.default.diamonds
LIMIT 10

Зверніть увагу на правила іменування: catalog.schema.table. Така тричастинна назва гарантує, що ви отримуєте правильні дані з Каталогу, який ми розглядали раніше.

Інтерактивні результати та візуалізації

Після виконання SQL-комірки Databricks надає інтерактивний набір результатів. Під таблицею результатів з’явиться значок "+" і напис "Visualization". Це дозволяє миттєво перетворити результати SQL на стовпчикові діаграми, лінійні графіки або кругові діаграми. На відміну від традиційних SQL-середовищ, де для перегляду діаграми потрібно експортувати дані в Excel, у Databricks ви можете створювати аналіз і візуалізацію в одному просторі.

Форматування SQL для зручності читання

SQL може стати важкочитабельною, коли запити ускладнюються. У Databricks є вбудований SQL Formatter. Його можна знайти на панелі інструментів комірки (зазвичай позначений маленькою іконкою "чарівної палички" або в меню "Edit"). Натискання цієї кнопки автоматично відформатує ключові слова та вирівняє стовпці, що полегшує перегляд коду вашими колегами у Workspace.

1. Якщо ви працюєте у Python-ноутбуці й хочете написати SQL-запит в одній комірці, яку «магічну команду» потрібно ввести на початку?

2. Який правильний спосіб посилання на таблицю в Databricks із використанням тричастинної конвенції іменування?

question mark

Якщо ви працюєте у Python-ноутбуці й хочете написати SQL-запит в одній комірці, яку «магічну команду» потрібно ввести на початку?

Виберіть правильну відповідь

question mark

Який правильний спосіб посилання на таблицю в Databricks із використанням тричастинної конвенції іменування?

Виберіть правильну відповідь

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 3. Розділ 3

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Секція 3. Розділ 3
some-alt