Summary  
This chapter covers how to group rows by one or more columns and apply aggregate functions (COUNT, AVG, MAX, MIN, SUM) to summarize data using the SQL GROUP BY clause.

General domain of usage  
Relational database querying and data aggregation

Tervetuloa **Intermediate SQL** -kurssille!

Ensimmäisessä osiossa perehdytään siihen, miten voimme **ryhmitellä ja yhdistää tietoja** tauluissamme.

Katsotaan, mitä "tietojen ryhmittely" tarkoittaa yksinkertaisen työntekijät-taulun esimerkin avulla:

## Tietojen ryhmittely

Tehtävänä on **selvittää, kuinka monta työntekijää on kussakin osastossa.** Tätä varten ryhmitellään tiedot `department`-sarakkeen mukaan ja käytetään aggregointia `COUNT(*)`-funktion avulla.

Toteutus näyttää tältä:

SELECT department, COUNT(*) AS number_of_employees
FROM employees
GROUP BY department

Kuten huomaat, **syntaksi** tietojen ryhmittelyyn näyttää tältä:

```sql
SELECT column1, AGG_FUNC(column2)
FROM table
GROUP BY column1
```

>Huomautus 
>
>`AGG_FUNC` tarkoittaa aggregaattifunktioita, kuten `MAX`, `MIN`, `COUNT` jne.

Tämä syntaksi on olemassa **tiettyjen arvojen löytämiseksi käyttämällä aggregaattifunktioita tietyissä sarakkeissa**.

Tarkastellaan toista esimerkkiä: tehtävänä on **löytää osasto, jolla on korkein keskipalkka.**

Tällaisten tietojen hakemiseksi täytyy **ryhmitellä** tiedot `department`-sarakkeen mukaan ja käyttää sitten `AVG()`-funktiota keskipalkan laskemiseen:

SELECT department, AVG(salary) as average_salary
FROM employees
GROUP BY department

Tässä osion kohdassa työskennellään **Montrealin metrojärjestelmän tietokannan** kanssa, joka sisältää `metro_travel_time`-taulun.



Tämä taulu sisältää tietoa **asemalinjasta** (`line_name`), sen **nimestä** (`station_name`) sekä **ajasta**, joka junalta kestää **matkustaa asemalta seuraavalle asemalle** (`time_to_next_station`).

Tältä tämä **taulu** näyttää ja tässä on **esikatselu datasta**:


Kuten huomaat, tämä on **yksinkertainen taulu**. Mietitään, missä voimme **käyttää ryhmittelyä** tässä.

Ilmeisin vaihtoehto on **ryhmittely metrolinjojen värien mukaan**. Tämä tarkoittaa, että voimme yhdistää tietoja ryhmittelemällä ne metrolinjan värin perusteella.




## Alias

Tehtävissä käytät usein käsitettä nimeltä **alias**. Alias on käytännössä sarakkeen "lempinimi", jonka määrittelet `SELECT`-lauseessa. Alias määritellään seuraavalla syntaksilla:

```sql
SELECT column AS alias
```

Alias vaikuttaa vain siihen, miten sarake näkyy vastauksessa.

Esimerkiksi `MAX(time)`-sarakkeen nimi voidaan muuttaa muotoon `max_time`, jos määrittelet sille tämän aliaksen. Tämä tekee tuloksista luettavampia ja selkeämpiä.

Tämä kurssi sopii erinomaisesti niille, joilla on jo perustiedot SQL:stä ja jotka haluavat syventyä edistyneempiin käsitteisiin tehokkaampien kyselyiden laatimiseksi. Kurssin aikana tutustut tietojen ryhmittelyyn ja ryhmiteltyjen tietojen suodattamiseen. Opit myös työskentelemään useiden taulukoiden kanssa samanaikaisesti, mukaan lukien niiden yhdistäminen. Lisäksi perehdyt erilaisiin taulukoiden liitostyyppeihin ja niiden käytännön soveltamiseen.

Tässä osiossa opit ryhmittelemään ja hallitsemaan tietoja tehokkaasti. Esittelemme GROUP BY -operaattorin tietojen ryhmittelyyn. Lisäksi opit suodattamaan ryhmiteltyjä tietoja HAVING-operaattorin avulla.

Opit sisäkkäisistä alikyselyistä, niiden luomisesta ja tehokkaasta käytöstä.

Tässä opit, kuinka yhdistetään useita tauluja, mikä mahdollistaa yhtenäisen taulun käytön ja yksinkertaistaa kyselyiden luomista.

Opi Data Definition Language (DDL) ja Data Manipulation Language (DML) -kielten perusteet SQL:ssä, mukaan lukien tietokantaobjektien luominen, muokkaaminen ja poistaminen sekä tietojen lisääminen, päivittäminen ja poistaminen tauluissa.

Group By -Lauseke

Tietojen ryhmittely

Alias

Lyhyet ohjeet

Ratkaisu