GROUP BY-Clausule

Vereisten

Inleiding tot SQL

Welkom bij de Intermediate SQL cursus!

In de eerste sectie ga je aan de slag met het groeperen en aggregeren van gegevens binnen je tabellen.

Hier volgt wat 'gegevens groeperen' betekent aan de hand van een eenvoudig voorbeeld van een employees-tabel:

Gegevens groeperen

De opdracht is om het aantal werknemers in elke afdeling te bepalen. Hiervoor groepeer je de gegevens op de kolom department en gebruik je aggregatie met de functie COUNT(*).

Hier zie je hoe de implementatie eruitziet:


              123
            
SELECT department, COUNT(*) AS number_of_employees
FROM employees
GROUP BY department

Zoals je ziet, ziet de syntaxis voor het groeperen van gegevens er als volgt uit:

SELECT column1, AGG_FUNC(column2)
FROM table
GROUP BY column1

Opmerking

AGG_FUNC betekent aggregatiefuncties zoals MAX, MIN, COUNT, enz.

Deze syntaxis wordt gebruikt om bepaalde waarden te vinden met behulp van aggregatiefuncties in specifieke kolommen.

Hier is een ander voorbeeld: je hebt de taak gekregen om het departement met het hoogste gemiddelde salaris te vinden.

Om zulke gegevens op te halen, moet je de gegevens groeperen op de kolom department en vervolgens de functie AVG() gebruiken om het gemiddelde salaris te berekenen:


              123
            
SELECT department, AVG(salary) as average_salary
FROM employees
GROUP BY department

In dit gedeelte van de sectie werk je met de Montreal Metro-systeemdatabase, die de tabel metro_travel_time bevat.

Deze tabel bevat informatie over de metrolijn (line_name), de naam (station_name) en de tijdsduur die een trein nodig heeft om van het ene station naar het volgende te reizen (time_to_next_station).

Hier zie je hoe deze tabel eruitziet en een voorbeeld van de gegevens:

Zoals je ziet is dit geen complexe tabel. Denk na over waar we hier groepering kunnen toepassen.

De meest voor de hand liggende optie is groeperen op de kleuren van metrolijnen. Dat betekent dat we de gegevens kunnen aggregeren door ze te groeperen op de kleur van de metrolijn.

Alias

In de opdrachten maak je vaak gebruik van een concept dat een alias wordt genoemd. Een alias is in feite een "bijnaam" voor een kolom die je ophaalt met een SELECT-statement. Dit wordt gespecificeerd met de volgende syntaxis:

SELECT column AS alias

Een alias beïnvloedt alleen hoe de kolom wordt weergegeven in het resultaat.

Bijvoorbeeld, in plaats van MAX(time) kan de kolom max_time worden genoemd als je die alias toekent. Dit maakt de uitvoer leesbaarder en duidelijker.

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 1

single

Veeg om het menu te tonen

Vereisten

Inleiding tot SQL

Welkom bij de Intermediate SQL cursus!

In de eerste sectie ga je aan de slag met het groeperen en aggregeren van gegevens binnen je tabellen.

Hier volgt wat 'gegevens groeperen' betekent aan de hand van een eenvoudig voorbeeld van een employees-tabel:

Gegevens groeperen

De opdracht is om het aantal werknemers in elke afdeling te bepalen. Hiervoor groepeer je de gegevens op de kolom department en gebruik je aggregatie met de functie COUNT(*).

Hier zie je hoe de implementatie eruitziet:


              123
            
SELECT department, COUNT(*) AS number_of_employees
FROM employees
GROUP BY department

Zoals je ziet, ziet de syntaxis voor het groeperen van gegevens er als volgt uit:

SELECT column1, AGG_FUNC(column2)
FROM table
GROUP BY column1

Opmerking

AGG_FUNC betekent aggregatiefuncties zoals MAX, MIN, COUNT, enz.

Deze syntaxis wordt gebruikt om bepaalde waarden te vinden met behulp van aggregatiefuncties in specifieke kolommen.

Hier is een ander voorbeeld: je hebt de taak gekregen om het departement met het hoogste gemiddelde salaris te vinden.

Om zulke gegevens op te halen, moet je de gegevens groeperen op de kolom department en vervolgens de functie AVG() gebruiken om het gemiddelde salaris te berekenen:


              123
            
SELECT department, AVG(salary) as average_salary
FROM employees
GROUP BY department

In dit gedeelte van de sectie werk je met de Montreal Metro-systeemdatabase, die de tabel metro_travel_time bevat.

Deze tabel bevat informatie over de metrolijn (line_name), de naam (station_name) en de tijdsduur die een trein nodig heeft om van het ene station naar het volgende te reizen (time_to_next_station).

Hier zie je hoe deze tabel eruitziet en een voorbeeld van de gegevens:

Zoals je ziet is dit geen complexe tabel. Denk na over waar we hier groepering kunnen toepassen.

De meest voor de hand liggende optie is groeperen op de kleuren van metrolijnen. Dat betekent dat we de gegevens kunnen aggregeren door ze te groeperen op de kleur van de metrolijn.

Alias

In de opdrachten maak je vaak gebruik van een concept dat een alias wordt genoemd. Een alias is in feite een "bijnaam" voor een kolom die je ophaalt met een SELECT-statement. Dit wordt gespecificeerd met de volgende syntaxis:

SELECT column AS alias

Een alias beïnvloedt alleen hoe de kolom wordt weergegeven in het resultaat.

Bijvoorbeeld, in plaats van MAX(time) kan de kolom max_time worden genoemd als je die alias toekent. Dit maakt de uitvoer leesbaarder en duidelijker.

Taak

Veeg om te beginnen met coderen

Je taak is om de langste tijd tot het volgende station op elke lijn te vinden. Dit helpt bij het bepalen van de langste reistijd tussen stations voor elke metrolijn. Gebruik hiervoor de functie MAX() en geef deze de alias max_time, waarbij je de gegevens groepeert op de kolom line_name.

Korte instructies

Haal de kolom line_name en de maximale waarde van de kolom time_to_next_station op uit de tabel metro_travel_time.
Voeg de alias max_time toe aan de maximale waarde.
Groepeer de gegevens op de kolom line_name.

Oplossing

Schakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 1

single

Vraag AI

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.