Clause Group By
Bienvenue dans le cours SQL Intermédiaire !
Dans la première section, une exploration des méthodes pour regrouper et agréger des données au sein des tables est proposée.
Une explication du concept de « regroupement de données » à l’aide d’un exemple simple de table des employés :
Regroupement de données
Un objectif consiste à déterminer le nombre d’employés dans chaque département. Pour cela, il convient de regrouper les données par la colonne department et d’utiliser une agrégation avec la fonction COUNT(*).
Voici à quoi ressemble l’implémentation :
123SELECT department, COUNT(*) AS number_of_employees FROM employees GROUP BY department
Ainsi, comme vous pouvez le constater, la syntaxe pour regrouper des données est la suivante :
SELECT column1, AGG_FUNC(column2)
FROM table
GROUP BY column1
AGG_FUNC désigne les fonctions d'agrégation telles que MAX, MIN, COUNT, etc.
Cette syntaxe permet de trouver certaines valeurs à l'aide de fonctions d'agrégation sur des colonnes spécifiques.
Prenons un autre exemple : la tâche consiste à trouver le département ayant le salaire moyen le plus élevé.
Pour obtenir ces données, il faut regrouper les données par la colonne department puis utiliser la fonction AVG() pour calculer le salaire moyen :
123SELECT department, AVG(salary) as average_salary FROM employees GROUP BY department
Dans cette partie de la section, nous travaillerons avec la base de données du métro de Montréal, qui contient la table metro_travel_time.
Cette table contient des informations sur la ligne de station (line_name), son nom (station_name), et le temps nécessaire pour qu'un train se déplace d'une station à la suivante (time_to_next_station).
Voici à quoi ressemble cette table et un aperçu des données qu'elle contient :
Comme vous pouvez le constater, il ne s'agit pas d'une table complexe. Réfléchissons à la manière dont nous pouvons utiliser le regroupement ici.
L'option la plus évidente est le regroupement par couleur des lignes de métro. Cela signifie que nous pouvons agréger les données en les regroupant par couleur de la ligne de métro.
Alias
Dans les exercices, le concept d’alias est fréquemment utilisé. Un alias est essentiellement un « surnom » donné à une colonne récupérée avec une instruction SELECT. Il s’utilise selon la syntaxe suivante :
SELECT column AS alias
Un alias n’influence que l’apparence de la colonne dans la réponse.
Par exemple, au lieu de MAX(time), la colonne peut être nommée max_time si cet alias est attribué. Cela rend le résultat plus lisible et compréhensible.
Swipe to start coding
Votre tâche consiste à trouver le temps le plus long jusqu'à la prochaine station sur chaque ligne. Cela nous permettra de déterminer le temps de trajet le plus long entre deux stations pour chaque ligne de métro. Pour cela, utilisez la fonction MAX() et attribuez-lui l'alias max_time, en regroupant les données par la colonne line_name.
Instructions brèves
- Récupérez la colonne
line_nameet la valeur maximale de la colonnetime_to_next_stationdepuis la tablemetro_travel_time. - Ajoutez l'alias
max_timepour la valeur maximale. - Regroupez les données par la colonne
line_name.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Can you explain more about how GROUP BY works in SQL?
What are some common aggregate functions I can use with GROUP BY?
How do I use aliases in more complex SQL queries?
Génial!
Completion taux amélioré à 4
Clause Group By
Glissez pour afficher le menu
Bienvenue dans le cours SQL Intermédiaire !
Dans la première section, une exploration des méthodes pour regrouper et agréger des données au sein des tables est proposée.
Une explication du concept de « regroupement de données » à l’aide d’un exemple simple de table des employés :
Regroupement de données
Un objectif consiste à déterminer le nombre d’employés dans chaque département. Pour cela, il convient de regrouper les données par la colonne department et d’utiliser une agrégation avec la fonction COUNT(*).
Voici à quoi ressemble l’implémentation :
123SELECT department, COUNT(*) AS number_of_employees FROM employees GROUP BY department
Ainsi, comme vous pouvez le constater, la syntaxe pour regrouper des données est la suivante :
SELECT column1, AGG_FUNC(column2)
FROM table
GROUP BY column1
AGG_FUNC désigne les fonctions d'agrégation telles que MAX, MIN, COUNT, etc.
Cette syntaxe permet de trouver certaines valeurs à l'aide de fonctions d'agrégation sur des colonnes spécifiques.
Prenons un autre exemple : la tâche consiste à trouver le département ayant le salaire moyen le plus élevé.
Pour obtenir ces données, il faut regrouper les données par la colonne department puis utiliser la fonction AVG() pour calculer le salaire moyen :
123SELECT department, AVG(salary) as average_salary FROM employees GROUP BY department
Dans cette partie de la section, nous travaillerons avec la base de données du métro de Montréal, qui contient la table metro_travel_time.
Cette table contient des informations sur la ligne de station (line_name), son nom (station_name), et le temps nécessaire pour qu'un train se déplace d'une station à la suivante (time_to_next_station).
Voici à quoi ressemble cette table et un aperçu des données qu'elle contient :
Comme vous pouvez le constater, il ne s'agit pas d'une table complexe. Réfléchissons à la manière dont nous pouvons utiliser le regroupement ici.
L'option la plus évidente est le regroupement par couleur des lignes de métro. Cela signifie que nous pouvons agréger les données en les regroupant par couleur de la ligne de métro.
Alias
Dans les exercices, le concept d’alias est fréquemment utilisé. Un alias est essentiellement un « surnom » donné à une colonne récupérée avec une instruction SELECT. Il s’utilise selon la syntaxe suivante :
SELECT column AS alias
Un alias n’influence que l’apparence de la colonne dans la réponse.
Par exemple, au lieu de MAX(time), la colonne peut être nommée max_time si cet alias est attribué. Cela rend le résultat plus lisible et compréhensible.
Swipe to start coding
Votre tâche consiste à trouver le temps le plus long jusqu'à la prochaine station sur chaque ligne. Cela nous permettra de déterminer le temps de trajet le plus long entre deux stations pour chaque ligne de métro. Pour cela, utilisez la fonction MAX() et attribuez-lui l'alias max_time, en regroupant les données par la colonne line_name.
Instructions brèves
- Récupérez la colonne
line_nameet la valeur maximale de la colonnetime_to_next_stationdepuis la tablemetro_travel_time. - Ajoutez l'alias
max_timepour la valeur maximale. - Regroupez les données par la colonne
line_name.
Solution
Merci pour vos commentaires !
single