single
Group By-sats
Svep för att visa menyn
Välkommen till kursen Intermediate SQL!
I det första avsnittet utforskar du hur du kan gruppera och aggregera data i dina tabeller.
Här är vad 'gruppering av data' innebär med ett enkelt exempel på en employees-tabell:
Gruppering av data
Uppgiften är att ta reda på antalet anställda i varje avdelning. För att göra detta grupperar du data efter kolumnen department och använder aggregering med funktionen COUNT(*).
Så här kommer implementationen att se ut:
123SELECT department, COUNT(*) AS number_of_employees FROM employees GROUP BY department
Som du kan se ser syntaxen för att gruppera data ut så här:
SELECT column1, AGG_FUNC(column2)
FROM table
GROUP BY column1
AGG_FUNC betyder aggregeringsfunktioner som MAX, MIN, COUNT osv.
Denna syntax används för att hitta vissa värden med hjälp av aggregeringsfunktioner i specifika kolumner.
Här är ett annat exempel: du har fått i uppgift att hitta avdelningen med högst genomsnittlig lön.
För att hämta sådan data behöver du gruppera data efter kolumnen department och sedan använda funktionen AVG() för att beräkna den genomsnittliga lönen:
123SELECT department, AVG(salary) as average_salary FROM employees GROUP BY department
I denna del av avsnittet kommer du att arbeta med Montreal Metro-systemets databas, som innehåller tabellen metro_travel_time.
Denna tabell innehåller information om stationens linje (line_name), dess namn (station_name) och tiden det tar för ett tåg att resa från en station till nästa (time_to_next_station).
Här är hur denna tabell ser ut och en datavisning i den:
Som du kan se är detta ingen komplex tabell. Fundera på var vi kan använda gruppering här.
Det mest uppenbara alternativet är gruppering efter färgerna på metrolinjerna. Det innebär att vi kan aggregera data genom att gruppera efter metrolinjens färg.
Alias
I uppgifterna kommer du ofta att använda ett koncept som kallas alias. Ett alias är i princip ett "smeknamn" för en kolumn som du hämtar med ett SELECT-uttryck. Det anges med följande syntax:
SELECT column AS alias
Ett alias påverkar endast hur kolumnen visas i svaret.
Till exempel, istället för MAX(time), kan kolumnen kallas max_time om du tilldelar det aliaset. Detta gör resultatet mer läsbart och tydligt.
Svep för att börja koda
Din uppgift är att hitta den längsta tiden till nästa station på varje linje. Detta hjälper till att fastställa den längsta restiden mellan stationer för varje tunnelbanelinje. Använd MAX()-funktionen och ge den aliaset max_time, och gruppera data efter kolumnen line_name.
Kortfattade instruktioner
- Hämta kolumnen
line_nameoch det maximala värdet av kolumnentime_to_next_stationfrån tabellenmetro_travel_time. - Lägg till aliaset
max_timeför det maximala värdet. - Gruppera data efter kolumnen
line_name.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal