Summary  
This chapter explains how to group rows by a specified column and apply aggregate functions (like COUNT and AVG) to compute summary statistics, and how to assign aliases to result columns for clarity.  

General domain of usage  
Analyzing public transit travel time data.

Velkommen til **Intermediate SQL**-kurset!

I det første afsnit udforskes, hvordan du kan **gruppere og aggregere data** i dine tabeller.

Her er, hvad 'gruppering af data' betyder ved hjælp af et simpelt eksempel på en employees-tabel:

## Gruppering af data

**Opgaven** er at **finde antallet af medarbejdere** i hver afdeling. For at gøre dette grupperes dataene efter kolonnen `department` og der anvendes aggregering med funktionen `COUNT(*)`.

Implementeringen vil se således ud:

SELECT department, COUNT(*) AS number_of_employees
FROM employees
GROUP BY department

Som det kan ses, ser **syntaksen** for gruppering af data således ud:

```sql
SELECT column1, AGG_FUNC(column2)
FROM table
GROUP BY column1
```

`AGG_FUNC` betyder aggregeringsfunktioner som `MAX`, `MIN`, `COUNT` osv.

Bemærk

Denne syntaks bruges til **at finde bestemte værdier ved hjælp af aggregeringsfunktioner i specifikke kolonner**.

Her er et andet eksempel: Du har fået til opgave **at finde den afdeling med den højeste gennemsnitsløn.**

For at hente sådanne data skal du **gruppere** dataene efter kolonnen `department` og derefter bruge funktionen `AVG()` til at beregne gennemsnitslønnen:

SELECT department, AVG(salary) as average_salary
FROM employees
GROUP BY department

I denne del af sektionen arbejder du med **Montreal Metro systemdatabasen**, som indeholder tabellen `metro_travel_time`. 



Denne tabel indeholder information om **stationens linje** (`line_name`), dens **navn** (`station_name`) og **den tid det tager** for et tog **at rejse fra én station til den næste** (`time_to_next_station`).

Her er, hvordan denne **tabel** ser ud samt et **dataview** af den:


Som du kan se, er dette **ikke en kompleks tabel**. Overvej, hvor vi kan **anvende gruppering** her.

Den mest oplagte mulighed er **gruppering efter farverne på metrolinjerne**. Det betyder, at vi kan aggregere dataene ved at gruppere dem efter farven på metrolinjen.




## Alias

I opgaverne vil du ofte bruge et koncept kaldet en **alias**. Et alias er i bund og grund et "kælenavn" for en kolonne, du henter med en `SELECT`-sætning. Det angives med følgende syntaks:

```sql
SELECT column AS alias
```

Et alias påvirker kun, hvordan kolonnen vises i svaret.

For eksempel, i stedet for `MAX(time)`, kan kolonnen kaldes `max_time`, hvis du tildeler det alias. Dette gør outputtet mere læsbart og tydeligt.

Dette kursus er ideelt for dem, der allerede har et grundlæggende kendskab til SQL og ønsker at fordybe sig i mere avancerede koncepter for at udforme mere kraftfulde forespørgsler. Gennem kurset vil du blive fortrolig med gruppering af data og filtrering af grupperede data. Du vil også lære at arbejde med flere tabeller samtidigt, herunder hvordan de kombineres. Derudover vil du udforske forskellige typer af tabel-joins og hvordan de anvendes i praksis.

I dette afsnit lærer du, hvordan du grupperer og håndterer data effektivt. Vi introducerer GROUP BY-operatoren til gruppering af data. Derudover lærer du, hvordan du filtrerer grupperede data ved hjælp af HAVING-operatoren.

Du vil lære om indlejrede underforespørgsler, hvordan de oprettes, og hvordan de anvendes effektivt.

Her vil du lære, hvordan man kombinerer flere tabeller, hvilket gør det muligt at arbejde med en samlet tabel og forenkle oprettelsen af forespørgsler.

Lær det grundlæggende om Data Definition Language (DDL) og Data Manipulation Language (DML) i SQL, herunder hvordan man opretter, ændrer og sletter databaseobjekter samt indsætter, opdaterer og sletter data i tabeller.

Group By-klausul

Gruppering af data

Alias

Korte instruktioner

Løsning