Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Skriva och Köra SQL-Kod | Notebook-upplevelsen
Databricks-Grunder: En Nybörjarguide

Skriva och Köra SQL-Kod

Svep för att visa menyn

Note
Definition

SQL (Structured Query Language) är det branschstandardiserade språket för att interagera med relationsdatabaser. I Databricks används SQL för att fråga tabeller i Lakehouse, skapa visualiseringar och utföra dataanalys inom notebooks.

Även om Python är kraftfullt för data engineering, är SQL fortfarande det mest populära språket för dataanalys. Databricks behandlar SQL som ett förstklassigt språk. Även om din notebooks standardspråk är inställt på Python kan du enkelt byta till SQL för att snabbt hämta data eller utföra komplexa joins.

Använda SQL i en SQL-notebook

Om du skapade din notebook med SQL som standardspråk kommer varje cell du skapar automatiskt att vara en SQL-cell. Du skriver helt enkelt din fråga – till exempel SELECT * FROM table_name – och kör den. Resultatet visas i ett rent, interaktivt tabellformat där du kan sortera kolumner eller söka efter specifika värden utan att skriva extra kod.

"Magic"-kommandot: %sql

Om du arbetar i en Python-anteckningsbok behöver du inte skapa en helt ny fil bara för att köra en SQL-fråga. Databricks använder "Magic Commands" för att byta språk direkt. Genom att skriva %sql allra först i en cell instruerar du klustret att ignorera Python och istället köra just den cellen som SQL-kod.

%sql
SELECT "Hello from the SQL engine" AS message

Fråga mot exempeldata

I avsnitt 2 laddade vi upp en fil som heter diamonds. Nu kan vi fråga den direkt. I en SQL-cell, prova följande kod:

SELECT 
  carat, 
  cut, 
  price 
FROM 
  workspace.default.diamonds
LIMIT 10

Observera namngivningskonventionen: catalog.schema.table. Detta tredelade namn säkerställer att du hämtar rätt data från katalogen vi utforskade tidigare.

Interaktiva resultat och visualiseringar

När en SQL-cell har kört klart tillhandahåller Databricks en interaktiv resultatmängd. Under resultattabellen ser du en "+"-ikon följt av "Visualisering". Detta gör det möjligt att omvandla dina SQL-resultat till stapeldiagram, linjediagram eller cirkeldiagram direkt. Till skillnad från traditionella SQL-miljöer där du kan behöva exportera data till Excel för att se ett diagram, låter Databricks dig skapa både analysen och visualiseringen på samma plats.

Formatering av SQL för läsbarhet

SQL kan bli svårläst när frågorna blir mer komplexa. Databricks har en inbyggd SQL-formaterare. Du hittar den i cellverktygsfältet (ofta representerad av en liten "trollstav"-ikon eller under menyn "Redigera"). Genom att klicka på denna indenteras nyckelord automatiskt och kolumner justeras, vilket gör koden enklare för dina kollegor att granska i Workspace.

1. Om du är i en Python-notebook och vill skriva en SQL-fråga i en enskild cell, vilket "Magic Command" måste du skriva överst?

2. Vad är det korrekta sättet att referera till en tabell i Databricks med hjälp av tredelad namngivningskonvention?

question mark

Om du är i en Python-notebook och vill skriva en SQL-fråga i en enskild cell, vilket "Magic Command" måste du skriva överst?

Vänligen välj det korrekta svaret

question mark

Vad är det korrekta sättet att referera till en tabell i Databricks med hjälp av tredelad namngivningskonvention?

Vänligen välj det korrekta svaret

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 3

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Avsnitt 3. Kapitel 3
some-alt