Summary  
The pandas .groupby() method groups DataFrame rows by the values in a specified column and lets you apply aggregation functions (e.g., mean, sum, count, min, max, median) to compute summary statistics for each group.

General domain of usage  
Airline flight delay analysis

Watch this video for a visual and auditory walkthrough of the `.groupby()` method in pandas. You will see how to group data by columns, apply aggregation functions like `.sum()` and `.mean()`, and interpret the results using the flight delay dataset. The video reinforces the code examples and table explanations you have just learned, making the grouping and aggregation process clear and practical.

Ik ben blij je in deze sectie te zien. Hier gaan we onze gegevens groeperen om informatie te vinden over verschillende groepen rijen. Bekijk de dataset over vertragingen (je kunt deze tabel horizontaal scrollen):


Gegevens groeperen is nuttig, en nu gaan we er dieper op in. Stel je voor dat je het aantal vertragingen per vluchtnummer wilt berekenen. Bekijk het codevoorbeeld en daarna de uitleg:

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)
data_flights = data[['Flight', 'Delay']].groupby('Flight').sum()
print(data_flights.head())

**Uitleg:**

```python
data[['Flight', 'Delay']].groupby('Flight').sum()
```

- `data[['Flight', 'Delay']]` - Dit zijn de kolommen waarmee je werkt, inclusief de kolommen waarop je groepeert;
- `groupby('Flight')` - De kolom `'Flight'` is het argument voor de `.groupby()`-functie. Dit betekent dat rijen met dezelfde waarde in de kolom `'Flight'` samen worden gegroepeerd;
- `.sum()` - Deze functie wordt toegepast op de rijen binnen elke groep die door `.groupby()` is gemaakt. In dit geval worden de waarden in de kolom `'Delay'` opgeteld voor rijen die tot dezelfde `'Flight'`-groep behoren.

Aangezien de kolom `'Delay'` alleen `0` (geen vertraging) of `1` (wel vertraging) als mogelijke waarden bevat, geeft de som van de rijen het aantal vertragingen per vlucht weer.

Opmerking

Eigenlijk is `.sum()` slechts één van de vele aggregatiefuncties die je kunt gebruiken. Je maakt gaandeweg kennis met al deze functies.

Deze cursus bevat veel nuttige functies voor een toekomstige data-analist. Je leert verschillende manieren om data te extraheren en er zelfs voorwaarden op toe te passen. Daarna raak je vertrouwd met methoden voor het groeperen van data. Ook leer je hoe je data kunt preprocessen. Elke sectie heeft zijn eigen dataset, waardoor de cursus boeiend blijft.

In deze sectie leer je hoe je specifieke kolommen kunt weergeven op basis van hun titels of indexen. Ook maak je kennis met de manieren waarop je rijen kunt selecteren op basis van indexen.

Hier leert u hoe u gegevens extraheert die aan specifieke voorwaarden voldoen. Ook leert u hoe u deze kunt combineren en zelfs uw eigen voorwaarden kunt creëren.

In deze sectie breidt u uw kennis uit over het instellen van verschillende datacondities. U leert controleren of uw gegevens zich in een gedefinieerde lijst met waarden bevinden of tussen twee waarden liggen. U leert ook hoe u de grootste en kleinste waarden kunt vinden.

Deze sectie is een van de meest fascinerende van de cursus. Hier leert u hoe u gegevens op verschillende manieren kunt groeperen. Dit zal u helpen als data-analist om informatie te vinden over specifieke datagroepen.

Deze sectie is een van de belangrijkste voor een data-analist, omdat het onmogelijk zal zijn om met de gegevens te werken als deze ontbrekende waarden of een onjuist formaat bevatten. Daarom leer je hier hoe je met dergelijke ongeschikte waarden omgaat.

DayOfWeek	Time
3	804.993130
4	804.452984
5	702.888362

Kennismaken met de .groupby() Methode