Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Group By-klausul | Gruppering
Intermediær SQL
Sektion 1. Kapitel 1
single

single

Group By-klausul

Stryg for at vise menuen

Prerequisites
Forudsætninger

Velkommen til Intermediate SQL-kurset!

I det første afsnit udforskes, hvordan du kan gruppere og aggregere data i dine tabeller.

Her er, hvad 'gruppering af data' betyder ved hjælp af et simpelt eksempel på en employees-tabel:

Gruppering af data

Opgaven er at finde antallet af medarbejdere i hver afdeling. For at gøre dette grupperes dataene efter kolonnen department og der anvendes aggregering med funktionen COUNT(*).

Implementeringen vil se således ud:

123
SELECT department, COUNT(*) AS number_of_employees FROM employees GROUP BY department

Som det kan ses, ser syntaksen for gruppering af data således ud:

SELECT column1, AGG_FUNC(column2)
FROM table
GROUP BY column1
Note
Bemærk

AGG_FUNC betyder aggregeringsfunktioner som MAX, MIN, COUNT osv.

Denne syntaks bruges til at finde bestemte værdier ved hjælp af aggregeringsfunktioner i specifikke kolonner.

Her er et andet eksempel: Du har fået til opgave at finde den afdeling med den højeste gennemsnitsløn.

For at hente sådanne data skal du gruppere dataene efter kolonnen department og derefter bruge funktionen AVG() til at beregne gennemsnitslønnen:

123
SELECT department, AVG(salary) as average_salary FROM employees GROUP BY department

I denne del af sektionen arbejder du med Montreal Metro systemdatabasen, som indeholder tabellen metro_travel_time.

Denne tabel indeholder information om stationens linje (line_name), dens navn (station_name) og den tid det tager for et tog at rejse fra én station til den næste (time_to_next_station).

Her er, hvordan denne tabel ser ud samt et dataview af den:

Som du kan se, er dette ikke en kompleks tabel. Overvej, hvor vi kan anvende gruppering her.

Den mest oplagte mulighed er gruppering efter farverne på metrolinjerne. Det betyder, at vi kan aggregere dataene ved at gruppere dem efter farven på metrolinjen.

Alias

I opgaverne vil du ofte bruge et koncept kaldet en alias. Et alias er i bund og grund et "kælenavn" for en kolonne, du henter med en SELECT-sætning. Det angives med følgende syntaks:

SELECT column AS alias

Et alias påvirker kun, hvordan kolonnen vises i svaret.

For eksempel, i stedet for MAX(time), kan kolonnen kaldes max_time, hvis du tildeler det alias. Dette gør outputtet mere læsbart og tydeligt.

Opgave

Swipe to start coding

Din opgave er at finde den længste tid til næste station på hver linje. Dette vil hjælpe med at bestemme den længste rejsetid mellem stationer for hver metrolinje. For at gøre dette skal du bruge funktionen MAX() og give den aliaset max_time, hvor du grupperer dataene efter kolonnen line_name.

Korte instruktioner

  • Hent kolonnen line_name og den maksimale værdi af kolonnen time_to_next_station fra tabellen metro_travel_time.
  • Tilføj aliaset max_time til den maksimale værdi.
  • Gruppér dataene efter kolonnen line_name.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 1. Kapitel 1
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

some-alt