Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Skrive og Kjøre SQL-kode | Notebook-opplevelsen
Databricks Grunnleggende: En Nybegynnerguide

Skrive og Kjøre SQL-kode

Sveip for å vise menyen

Note
Definisjon

SQL (Structured Query Language) er bransjestandarden for å samhandle med relasjonsdatabaser. I Databricks brukes SQL til å forespørre tabeller i Lakehouse, lage visualiseringer og utføre dataanalyse i notatbøker.

Selv om Python er kraftig for data engineering, er SQL fortsatt det mest populære språket for dataanalyse. Databricks behandler SQL som et førsteklasses språk. Selv om standard språket i notatboken din er satt til Python, kan du enkelt bytte til SQL for å utføre raske dataoppslag eller komplekse sammenføyninger.

Bruk av SQL i en SQL-notatbok

Hvis du opprettet notatboken din med SQL som standardspråk, vil hver celle du lager automatisk være en SQL-celle. Du skriver bare inn spørringen din – for eksempel SELECT * FROM table_name – og kjører den. Resultatet vises i et ryddig, interaktivt tabellformat hvor du kan sortere kolonner eller søke etter spesifikke verdier uten å skrive ekstra kode.

"Magic"-kommandoen: %sql

Når du arbeider i en Python-notatbok, trenger du ikke opprette en helt ny fil bare for å kjøre en SQL-spørring. Databricks bruker "Magic Commands" for å bytte språk underveis. Ved å skrive %sql helt først i en celle, instruerer du klyngen om å ignorere Python og kjøre akkurat den cellen som SQL-kode.

%sql
SELECT "Hello from the SQL engine" AS message

Spørring mot eksempeldata

I seksjon 2 lastet vi opp en fil kalt diamonds. Nå kan vi spørre direkte mot denne. I en SQL-celle, prøv følgende kode:

SELECT 
  carat, 
  cut, 
  price 
FROM 
  workspace.default.diamonds
LIMIT 10

Merk navnekonvensjonen: catalog.schema.table. Dette tredelte navnet sikrer at du henter riktige data fra Catalog vi utforsket tidligere.

Interaktive resultater og visualiseringer

Når en SQL-celle er ferdig med å kjøre, gir Databricks et interaktivt resultatsett. Under resultat-tabellen vil du se et "+"-ikon etterfulgt av "Visualisering". Dette lar deg umiddelbart gjøre SQL-resultatene om til stolpediagrammer, linjediagrammer eller sektordiagrammer. I motsetning til tradisjonelle SQL-miljøer hvor du kanskje må eksportere data til Excel for å se et diagram, lar Databricks deg bygge både analysen og visualiseringen i samme arbeidsflate.

Formatering av SQL for lesbarhet

SQL kan bli vanskelig å lese etter hvert som spørringene blir mer komplekse. Databricks har en innebygd SQL Formatter. Du finner denne i celleverktøylinjen (ofte representert med et lite "tryllestav"-ikon eller under "Rediger"-menyen). Ved å klikke på denne vil nøkkelordene dine automatisk bli innrykket og kolonnene justert, noe som gjør koden din enklere for kollegaer å gjennomgå i Workspace.

1. Hvis du er i en Python-notatbok og vil skrive en SQL-spørring i én celle, hvilken "Magic Command" må du skrive øverst?

2. Hva er riktig måte å referere til en tabell i Databricks ved bruk av tredelt navnekonvensjon?

question mark

Hvis du er i en Python-notatbok og vil skrive en SQL-spørring i én celle, hvilken "Magic Command" må du skrive øverst?

Velg det helt riktige svaret

question mark

Hva er riktig måte å referere til en tabell i Databricks ved bruk av tredelt navnekonvensjon?

Velg det helt riktige svaret

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 3

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Seksjon 3. Kapittel 3
some-alt