single
Group By-klausul
Stryg for at vise menuen
Velkommen til Intermediate SQL-kurset!
I det første afsnit udforskes, hvordan du kan gruppere og aggregere data i dine tabeller.
Her er, hvad 'gruppering af data' betyder ved hjælp af et simpelt eksempel på en employees-tabel:
Gruppering af data
Opgaven er at finde antallet af medarbejdere i hver afdeling. For at gøre dette grupperes dataene efter kolonnen department og der anvendes aggregering med funktionen COUNT(*).
Implementeringen vil se således ud:
123SELECT department, COUNT(*) AS number_of_employees FROM employees GROUP BY department
Som det kan ses, ser syntaksen for gruppering af data således ud:
SELECT column1, AGG_FUNC(column2)
FROM table
GROUP BY column1
AGG_FUNC betyder aggregeringsfunktioner som MAX, MIN, COUNT osv.
Denne syntaks bruges til at finde bestemte værdier ved hjælp af aggregeringsfunktioner i specifikke kolonner.
Her er et andet eksempel: Du har fået til opgave at finde den afdeling med den højeste gennemsnitsløn.
For at hente sådanne data skal du gruppere dataene efter kolonnen department og derefter bruge funktionen AVG() til at beregne gennemsnitslønnen:
123SELECT department, AVG(salary) as average_salary FROM employees GROUP BY department
I denne del af sektionen arbejder du med Montreal Metro systemdatabasen, som indeholder tabellen metro_travel_time.
Denne tabel indeholder information om stationens linje (line_name), dens navn (station_name) og den tid det tager for et tog at rejse fra én station til den næste (time_to_next_station).
Her er, hvordan denne tabel ser ud samt et dataview af den:
Som du kan se, er dette ikke en kompleks tabel. Overvej, hvor vi kan anvende gruppering her.
Den mest oplagte mulighed er gruppering efter farverne på metrolinjerne. Det betyder, at vi kan aggregere dataene ved at gruppere dem efter farven på metrolinjen.
Alias
I opgaverne vil du ofte bruge et koncept kaldet en alias. Et alias er i bund og grund et "kælenavn" for en kolonne, du henter med en SELECT-sætning. Det angives med følgende syntaks:
SELECT column AS alias
Et alias påvirker kun, hvordan kolonnen vises i svaret.
For eksempel, i stedet for MAX(time), kan kolonnen kaldes max_time, hvis du tildeler det alias. Dette gør outputtet mere læsbart og tydeligt.
Swipe to start coding
Din opgave er at finde den længste tid til næste station på hver linje. Dette vil hjælpe med at bestemme den længste rejsetid mellem stationer for hver metrolinje. For at gøre dette skal du bruge funktionen MAX() og give den aliaset max_time, hvor du grupperer dataene efter kolonnen line_name.
Korte instruktioner
- Hent kolonnen
line_nameog den maksimale værdi af kolonnentime_to_next_stationfra tabellenmetro_travel_time. - Tilføj aliaset
max_timetil den maksimale værdi. - Gruppér dataene efter kolonnen
line_name.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat