GROUP BY-Clausule
Welkom bij de Intermediate SQL cursus!
In de eerste sectie duiken we in hoe we gegevens kunnen groeperen en aggregeren binnen onze tabellen.
Laten we begrijpen wat "gegevens groeperen" betekent aan de hand van een eenvoudig voorbeeld van een werknemers tabel:
Gegevens Groeperen
We hebben een taak om het aantal werknemers in elke afdeling te achterhalen. Om dit te doen, zullen we de gegevens groeperen op de kolom department
en aggregatie gebruiken met de COUNT(*)
functie.
Zo ziet de implementatie eruit:
SELECT department, COUNT(*) AS number_of_employees FROM employees GROUP BY department
Dus, zoals je kunt zien, ziet de syntaxis voor het groeperen van gegevens er zo uit:
sql
Opmerking
AGG_FUNC
betekent aggregatiefuncties zoalsMAX
,MIN
,COUNT
, enz.
Deze syntaxis bestaat om bepaalde waarden te vinden met behulp van aggregatiefuncties in specifieke kolommen.
Laten we een ander voorbeeld bekijken: we hebben de taak gekregen om de afdeling met het hoogste gemiddelde salaris te vinden.
Om dergelijke gegevens op te halen, moeten we de gegevens groeperen op de department
kolom en vervolgens de AVG()
functie gebruiken om het gemiddelde salaris te berekenen:
SELECT department, AVG(salary) as average_salary FROM employees GROUP BY department
In dit deel van de sectie zullen we werken met de Montreal Metro-systeemdatabase, die de metro_travel_time
tabel bevat.
Deze tabel bevat informatie over de stationlijn (line_name
), de naam (station_name
), en de hoeveelheid tijd die het kost voor een trein om van het ene station naar het volgende te reizen (time_to_next_station
).
Hier is hoe deze tabel eruitziet en de gegevensvoorbeeld erin:
Zoals je kunt zien, is dit geen complexe tabel. Laten we nadenken over waar we hier groepering kunnen gebruiken.
De meest voor de hand liggende optie is groeperen op de kleuren van metrolijnen. Dat betekent dat we de gegevens kunnen aggregeren door ze te groeperen op de kleur van de metrolijn.
Alias
In de opdrachten gebruik je vaak een concept genaamd een alias. Een alias is in wezen een "bijnaam" voor een kolom die je ophaalt met een SELECT
-verklaring. Het wordt gespecificeerd met behulp van de volgende syntaxis:
sql
Een alias beïnvloedt alleen hoe de kolom in de respons verschijnt.
Bijvoorbeeld, in plaats van MAX(time)
, kan de kolom max_time
worden genoemd als je die alias toewijst. Dit maakt de uitvoer leesbaarder en duidelijker.
Swipe to start coding
Je taak is om de langste tijd tot het volgende station op elke lijn te vinden. Dit stelt ons in staat om de langste reistijd tussen stations voor elke metrolijn te bepalen. Gebruik hiervoor de MAX()
-functie en geef het de alias max_time
, waarbij je de gegevens groepeert op de kolom line_name
.
Korte Instructies
- Haal de kolom
line_name
en de maximale waarde van de kolomtime_to_next_station
op. - Voeg de alias
max_time
toe voor de maximale waarde. - Groepeer de gegevens op de kolom
line_name
.
Zodra je deze taak hebt voltooid, klik je op de knop onder de code om je oplossing te controleren.
Oplossing
Bedankt voor je feedback!