Skrive og Kjøre SQL-kode
Sveip for å vise menyen
SQL (Structured Query Language) er bransjestandarden for å samhandle med relasjonsdatabaser. I Databricks brukes SQL til å forespørre tabeller i Lakehouse, lage visualiseringer og utføre dataanalyse i notatbøker.
Selv om Python er kraftig for data engineering, er SQL fortsatt det mest populære språket for dataanalyse. Databricks behandler SQL som et førsteklasses språk. Selv om standard språket i notatboken din er satt til Python, kan du enkelt bytte til SQL for å utføre raske dataoppslag eller komplekse sammenføyninger.
Bruk av SQL i en SQL-notatbok
Hvis du opprettet notatboken din med SQL som standardspråk, vil hver celle du lager automatisk være en SQL-celle. Du skriver bare inn spørringen din – for eksempel SELECT * FROM table_name – og kjører den. Resultatet vises i et ryddig, interaktivt tabellformat hvor du kan sortere kolonner eller søke etter spesifikke verdier uten å skrive ekstra kode.
"Magic"-kommandoen: %sql
Når du arbeider i en Python-notatbok, trenger du ikke opprette en helt ny fil bare for å kjøre en SQL-spørring. Databricks bruker "Magic Commands" for å bytte språk underveis. Ved å skrive %sql helt først i en celle, instruerer du klyngen om å ignorere Python og kjøre akkurat den cellen som SQL-kode.
%sql
SELECT "Hello from the SQL engine" AS message
Spørring mot eksempeldata
I seksjon 2 lastet vi opp en fil kalt diamonds. Nå kan vi spørre direkte mot denne. I en SQL-celle, prøv følgende kode:
SELECT
carat,
cut,
price
FROM
workspace.default.diamonds
LIMIT 10
Merk navnekonvensjonen: catalog.schema.table. Dette tredelte navnet sikrer at du henter riktige data fra Catalog vi utforsket tidligere.
Interaktive resultater og visualiseringer
Når en SQL-celle er ferdig med å kjøre, gir Databricks et interaktivt resultatsett. Under resultat-tabellen vil du se et "+"-ikon etterfulgt av "Visualisering". Dette lar deg umiddelbart gjøre SQL-resultatene om til stolpediagrammer, linjediagrammer eller sektordiagrammer. I motsetning til tradisjonelle SQL-miljøer hvor du kanskje må eksportere data til Excel for å se et diagram, lar Databricks deg bygge både analysen og visualiseringen i samme arbeidsflate.
Formatering av SQL for lesbarhet
SQL kan bli vanskelig å lese etter hvert som spørringene blir mer komplekse. Databricks har en innebygd SQL Formatter. Du finner denne i celleverktøylinjen (ofte representert med et lite "tryllestav"-ikon eller under "Rediger"-menyen). Ved å klikke på denne vil nøkkelordene dine automatisk bli innrykket og kolonnene justert, noe som gjør koden din enklere for kollegaer å gjennomgå i Workspace.
1. Hvis du er i en Python-notatbok og vil skrive en SQL-spørring i én celle, hvilken "Magic Command" må du skrive øverst?
2. Hva er riktig måte å referere til en tabell i Databricks ved bruk av tredelt navnekonvensjon?
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår