Summary  
The pandas .groupby() method groups DataFrame rows by the values in a specified column and lets you apply aggregation functions (e.g., mean, sum, count, min, max, median) to compute summary statistics for each group.

General domain of usage  
Airline flight delay analysis

Watch this video for a visual and auditory walkthrough of the `.groupby()` method in pandas. You will see how to group data by columns, apply aggregation functions like `.sum()` and `.mean()`, and interpret the results using the flight delay dataset. The video reinforces the code examples and table explanations you have just learned, making the grouping and aggregation process clear and practical.

Ich freue mich, Sie in diesem Abschnitt begrüßen zu dürfen. Hier werden wir unsere Daten gruppieren, um Informationen über verschiedene Gruppen von Zeilen zu erhalten. Untersuchen Sie den Datensatz zu Verzögerungen (Sie können diese Tabelle horizontal scrollen):


Das Gruppieren von Daten ist vorteilhaft, und nun werden wir tiefer darauf eingehen. Stellen Sie sich vor, Sie möchten die Anzahl der Verzögerungen für jede Flugnummer berechnen. Sehen Sie sich das Codebeispiel an und anschließend die Erklärung:

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)
data_flights = data[['Flight', 'Delay']].groupby('Flight').sum()
print(data_flights.head())

**Erläuterung:**

```python
data[['Flight', 'Delay']].groupby('Flight').sum()
```

- `data[['Flight', 'Delay']]` – Dies sind die Spalten, mit denen gearbeitet wird, einschließlich der Spalten, nach denen gruppiert wird;
- `groupby('Flight')` – Die Spalte `'Flight'` ist das Argument für die `.groupby()`-Funktion. Das bedeutet, dass Zeilen mit demselben Wert in der Spalte `'Flight'` zusammengefasst werden;
- `.sum()` – Diese Funktion wird auf die Zeilen innerhalb jeder durch `.groupby()` erstellten Gruppe angewendet. In diesem Fall werden die Werte in der Spalte `'Delay'` für Zeilen mit derselben `'Flight'`-Gruppe summiert.

Da die Spalte `'Delay'` nur `0` (keine Verspätung) oder `1` (eine Verspätung) als mögliche Werte enthält, stellt die Summe der Zeilen die Anzahl der Verspätungen für jeden Flug dar.

Hinweis

Tatsächlich ist `.sum()` nur eine von vielen Aggregationsfunktionen, die verwendet werden können. Im weiteren Verlauf werden alle diese Funktionen vorgestellt.

Dieser Kurs enthält viele nützliche Funktionen für angehende Data Analysts. Sie lernen verschiedene Methoden zur Extraktion von Daten kennen und können sogar Bedingungen darauf anwenden. Anschließend werden Sie mit Methoden zur Gruppierung von Daten vertraut gemacht. Außerdem lernen Sie, wie man Daten vorverarbeitet. Jeder Abschnitt verfügt über einen eigenen Datensatz, sodass der Kurs spannend bleibt.

In diesem Abschnitt lernen Sie, wie Sie bestimmte Spalten anhand ihrer Titel oder Indizes ausgeben. Außerdem machen Sie sich mit den Methoden vertraut, mit denen Sie Zeilen anhand von Indizes auswählen können.

Hier lernen Sie, wie man Daten extrahiert, die bestimmte Bedingungen erfüllen. Außerdem lernen Sie, wie man diese kombiniert und sogar eigene Bedingungen erstellt.

In diesem Abschnitt erweitern Sie Ihr Wissen über das Festlegen verschiedener Datenbedingungen. Sie lernen, zu überprüfen, ob Ihre Daten in einer definierten Werteliste oder zwischen zwei Werten liegen. Sie erfahren außerdem, wie Sie die größten und kleinsten Werte finden.

Dieser Abschnitt ist einer der faszinierendsten des Kurses. Hier lernen Sie, wie Sie Daten auf verschiedene Arten gruppieren können. Dies wird Ihnen als Data Analyst helfen, Informationen über bestimmte Datengruppen zu ermitteln.

Dieser Abschnitt ist einer der wichtigsten für Datenanalysten, da es unmöglich ist, mit Daten zu arbeiten, wenn sie fehlende Werte oder ein falsches Format enthalten. Daher lernen Sie hier, wie man mit solchen ungeeigneten Werten umgeht.

DayOfWeek	Time
3	804.993130
4	804.452984
5	702.888362

Getting Familiar With the .groupby()-Methode