SQL-koodin Kirjoittaminen ja Suorittaminen
Pyyhkäise näyttääksesi valikon
SQL (Structured Query Language) on alan standardikieli relaatiotietokantojen käsittelyyn. Databricksissa SQL:ää käytetään Lakehouse-taulujen kyselyihin, visualisointien rakentamiseen ja tietojen analysointiin muistikirjoissa.
Vaikka Python on tehokas tietojenkäsittelyyn, SQL on edelleen suosituin kieli tietojen analysointiin. Databricks käsittelee SQL:ää ensiluokkaisena kielenä. Vaikka muistikirjasi oletuskieli olisi Python, voit helposti vaihtaa SQL:ään tehdäksesi nopeita tietohakuja tai monimutkaisia liitoksia.
SQL:n käyttäminen SQL-muistikirjassa
Jos loit muistikirjasi niin, että SQL on oletuskielenä, jokainen luomasi solu on automaattisesti SQL-solu. Kirjoitat vain kyselysi – esimerkiksi SELECT * FROM table_name – ja suoritat sen. Tulokset näytetään selkeässä, interaktiivisessa taulukkomuodossa, jossa voit lajitella sarakkeita tai etsiä tiettyjä arvoja ilman lisäkoodia.
"Magic"-komento: %sql
Jos työskentelet Python-muistikirjassa, sinun ei tarvitse luoda kokonaan uutta tiedostoa suorittaaksesi SQL-kyselyn. Databricks käyttää "Magic-komentoja" kielen vaihtamiseen lennossa. Kirjoittamalla %sql solun alkuun, ohjeistat klusteria ohittamaan Pythonin ja suorittamaan kyseisen solun SQL-koodina.
%sql
SELECT "Hello from the SQL engine" AS message
Esimerkkidatan kysely
Osiossa 2 latasimme tiedoston nimeltä diamonds. Nyt voimme kysellä sitä suoraan. Kokeile seuraavaa koodia SQL-solussa:
SELECT
carat,
cut,
price
FROM
workspace.default.diamonds
LIMIT 10
Huomaa nimeämiskäytäntö: catalog.schema.table. Tämä kolmiosainen nimi varmistaa, että haet oikeat tiedot Catalogista, jota tarkastelimme aiemmin.
Interaktiiviset tulokset ja visualisoinnit
Kun SQL-solu on suoritettu, Databricks tarjoaa interaktiivisen tulosjoukon. Tulos-taulukon alapuolella näkyy "+"-kuvake ja "Visualization". Tämän avulla voit muuntaa SQL-tulokset pylväsdiagrammeiksi, viivagraafeiksi tai piirakkakaavioiksi välittömästi. Toisin kuin perinteisissä SQL-ympäristöissä, joissa tiedot täytyy ehkä viedä Exceliin kaavioiden luomiseksi, Databricks mahdollistaa analyysin ja visualisoinnin rakentamisen samassa tilassa.
SQL:n muotoilu luettavuuden parantamiseksi
SQL-kyselyt voivat muuttua vaikealukuisiksi niiden monimutkaistuessa. Databricks sisältää sisäänrakennetun SQL-muotoilijan. Löydät tämän solun työkalupalkista (yleensä pieni "taikasauva"-ikoni tai "Muokkaa"-valikosta). Tämän painaminen sisentää automaattisesti avainsanat ja tasaa sarakkeet, mikä helpottaa koodin tarkastelua työtilassa muiden tiimin jäsenten kanssa.
1. Jos olet Python-muistikirjassa ja haluat kirjoittaa SQL-kyselyn yhteen soluun, mikä "Magic Command" tulee kirjoittaa solun alkuun?
2. Mikä on oikea tapa viitata tauluun Databricksissa kolmitasoisen nimeämiskäytännön mukaisesti?
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme