Summary  
The pandas .groupby() method groups DataFrame rows by the values in a specified column and lets you apply aggregation functions (e.g., mean, sum, count, min, max, median) to compute summary statistics for each group.

General domain of usage  
Airline flight delay analysis

Watch this video for a visual and auditory walkthrough of the `.groupby()` method in pandas. You will see how to group data by columns, apply aggregation functions like `.sum()` and `.mean()`, and interpret the results using the flight delay dataset. The video reinforces the code examples and table explanations you have just learned, making the grouping and aggregation process clear and practical.

Je suis heureux de vous retrouver dans cette section. Ici, nous allons regrouper nos données afin d'obtenir des informations sur différents groupes de lignes. Examinez l'ensemble de données sur les retards (vous pouvez faire défiler ce tableau horizontalement) :


Le regroupement des données est utile, et nous allons maintenant l'explorer plus en détail. Imaginez que vous souhaitez calculer le nombre de retards pour chaque numéro de vol. Regardez l'exemple de code, puis l'explication :

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)
data_flights = data[['Flight', 'Delay']].groupby('Flight').sum()
print(data_flights.head())

**Explication :**

```python
data[['Flight', 'Delay']].groupby('Flight').sum()
```

- `data[['Flight', 'Delay']]` - Colonnes sélectionnées pour le traitement, y compris celles utilisées pour le regroupement ;
- `groupby('Flight')` - La colonne `'Flight'` est l'argument de la fonction `.groupby()`. Cela signifie que les lignes ayant la même valeur dans la colonne `'Flight'` seront regroupées ;
- `.sum()` - Fonction appliquée aux lignes de chaque groupe créé par `.groupby()`. Dans ce cas, elle additionne les valeurs de la colonne `'Delay'` pour les lignes appartenant au même groupe `'Flight'`.

Étant donné que la colonne `'Delay'` ne contient que `0` (aucun retard) ou `1` (retard survenu) comme valeurs possibles, la somme des lignes représente le nombre de retards pour chaque vol.

Remarque

En réalité, `.sum()` fait partie des nombreuses fonctions d'agrégation disponibles. Vous les découvrirez toutes au fur et à mesure de votre progression.

Ce cours contient de nombreuses fonctions utiles pour un futur analyste de données. Vous apprendrez différentes méthodes d'extraction de données et pourrez même y appliquer des conditions. Ensuite, vous vous familiariserez avec les méthodes de regroupement des données. De plus, vous découvrirez comment prétraiter les données. Chaque section dispose de son propre ensemble de données, rendant le cours captivant.

Cette section vous apprendra comment afficher des colonnes spécifiques par leurs titres ou indices. Vous vous familiariserez également avec les différentes méthodes de sélection des lignes par indices.

Ici, vous apprendrez à extraire des données répondant à des conditions spécifiques. Vous apprendrez également à les combiner et même à créer vos propres conditions.

Dans cette section, vous approfondirez vos connaissances sur la définition de différentes conditions de données. Vous apprendrez à vérifier si vos données figurent dans une liste de valeurs définie ou se situent entre deux valeurs. Vous apprendrez également à identifier les valeurs les plus grandes et les plus petites.

Cette section est l'une des plus fascinantes du cours. Ici, vous apprendrez à regrouper des données de différentes manières. Cela vous aidera à travailler en tant qu'analyste de données pour obtenir des informations sur des groupes de données spécifiques.

Cette section est l'une des plus importantes pour un analyste de données, car si les données contiennent des valeurs manquantes ou sont dans un format incorrect, il sera impossible de les exploiter. Ainsi, vous apprendrez ici comment traiter de telles valeurs inappropriées.

DayOfWeek	Time
3	804.993130
4	804.452984
5	702.888362

Se Familiariser Avec La Méthode .groupby()