Написання та Виконання SQL-Коду
Свайпніть щоб показати меню
SQL (Structured Query Language) — це стандартна мова для взаємодії з реляційними базами даних. У Databricks SQL використовується для запитів до таблиць у Lakehouse, створення візуалізацій та виконання аналізу даних у блокнотах.
Хоча Python є потужним інструментом для інженерії даних, SQL залишається найпопулярнішою мовою для аналізу даних. Databricks розглядає SQL як повноцінну мову. Навіть якщо мова за замовчуванням у вашому блокноті — Python, ви можете легко переключитися на SQL для швидкого перегляду даних або виконання складних об'єднань.
Використання SQL у SQL-блокноті
Якщо ви створили блокнот із SQL як мовою за замовчуванням, кожна нова клітинка автоматично буде SQL-клітинкою. Просто введіть свій запит — наприклад, SELECT * FROM table_name — і виконайте його. Результат відобразиться у зручному інтерактивному табличному форматі, де можна сортувати стовпці або шукати конкретні значення без написання додаткового коду.
"Магічна" команда: %sql
Якщо ви працюєте у Python-ноутбуці, немає потреби створювати окремий файл лише для виконання SQL-запиту. Databricks використовує "магічні команди" для миттєвого перемикання між мовами. Ввівши %sql на самому початку комірки, ви вказуєте кластеру ігнорувати Python і виконати цю конкретну комірку як SQL-код.
%sql
SELECT "Hello from the SQL engine" AS message
Запити до зразкових даних
У розділі 2 ми завантажили файл під назвою diamonds. Тепер ми можемо виконувати до нього запити безпосередньо. У SQL-комірці спробуйте наступний код:
SELECT
carat,
cut,
price
FROM
workspace.default.diamonds
LIMIT 10
Зверніть увагу на правила іменування: catalog.schema.table. Така тричастинна назва гарантує, що ви отримуєте правильні дані з Каталогу, який ми розглядали раніше.
Інтерактивні результати та візуалізації
Після виконання SQL-комірки Databricks надає інтерактивний набір результатів. Під таблицею результатів з’явиться значок "+" і напис "Visualization". Це дозволяє миттєво перетворити результати SQL на стовпчикові діаграми, лінійні графіки або кругові діаграми. На відміну від традиційних SQL-середовищ, де для перегляду діаграми потрібно експортувати дані в Excel, у Databricks ви можете створювати аналіз і візуалізацію в одному просторі.
Форматування SQL для зручності читання
SQL може стати важкочитабельною, коли запити ускладнюються. У Databricks є вбудований SQL Formatter. Його можна знайти на панелі інструментів комірки (зазвичай позначений маленькою іконкою "чарівної палички" або в меню "Edit"). Натискання цієї кнопки автоматично відформатує ключові слова та вирівняє стовпці, що полегшує перегляд коду вашими колегами у Workspace.
1. Якщо ви працюєте у Python-ноутбуці й хочете написати SQL-запит в одній комірці, яку «магічну команду» потрібно ввести на початку?
2. Який правильний спосіб посилання на таблицю в Databricks із використанням тричастинної конвенції іменування?
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат