Summary  
The pandas .groupby() method groups DataFrame rows by the values in a specified column and lets you apply aggregation functions (e.g., mean, sum, count, min, max, median) to compute summary statistics for each group.

General domain of usage  
Airline flight delay analysis

Watch this video for a visual and auditory walkthrough of the `.groupby()` method in pandas. You will see how to group data by columns, apply aggregation functions like `.sum()` and `.mean()`, and interpret the results using the flight delay dataset. The video reinforces the code examples and table explanations you have just learned, making the grouping and aggregation process clear and practical.

Jag är glad att se dig i denna sektion. Här kommer vi att gruppera våra data för att hitta information om olika grupper av rader. Undersök datasettet om förseningar (du kan scrolla horisontellt i denna tabell):


Att gruppera data är fördelaktigt, och nu kommer vi att fördjupa oss i detta. Föreställ dig att du vill räkna antalet förseningar för varje flygnummer. Titta på kodexemplet och sedan på förklaringen:

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)
data_flights = data[['Flight', 'Delay']].groupby('Flight').sum()
print(data_flights.head())

**Förklaring:**

```python
data[['Flight', 'Delay']].groupby('Flight').sum()
```

- `data[['Flight', 'Delay']]` – Dessa är kolumnerna du arbetar med, inklusive de kolumner du grupperar på;
- `groupby('Flight')` – Kolumnen `'Flight'` är argumentet för funktionen `.groupby()`. Detta innebär att rader med samma värde i kolumnen `'Flight'` kommer att grupperas tillsammans;
- `.sum()` – Denna funktion används på rader inom varje grupp som skapats av `.groupby()`. I detta fall summeras värdena i kolumnen `'Delay'` för rader som tillhör samma `'Flight'`-grupp.

Eftersom kolumnen `'Delay'` endast innehåller `0` (ingen försening) eller `1` (en försening har inträffat) som möjliga värden, representerar summan av raderna antalet förseningar för varje flight.

Notera

Faktum är att `.sum()` är en av många aggregeringsfunktioner du kan använda. Du kommer att bekanta dig med alla dessa under kursens gång.

Denna kurs innehåller många användbara funktioner för en framtida dataanalytiker. Du kommer att lära dig olika sätt att extrahera data och även sätta villkor på den. Därefter kommer du att bli bekant med metoder för att gruppera data. Du kommer också att lära dig hur man förbehandlar data. Varje avsnitt har sitt eget dataset, vilket gör kursen engagerande.

Detta avsnitt lär dig hur du kan visa specifika kolumner utifrån deras titlar eller index. Du kommer även att bekanta dig med olika sätt att välja rader utifrån index.

Här kommer du att lära dig hur du extraherar data som uppfyller specifika villkor. Du kommer även att lära dig hur du kombinerar dessa och till och med skapar egna.

I det här avsnittet kommer du att fördjupa dina kunskaper om att ställa in olika datavillkor. Du kommer att lära dig att kontrollera om dina data finns i en definierad lista av värden eller mellan två värden. Du kommer även att lära dig hur du hittar de största och minsta värdena.

Detta avsnitt är ett av de mest fascinerande i kursen. Här kommer du att lära dig hur man grupperar data på olika sätt. Det kommer att hjälpa dig att arbeta som dataanalytiker för att hitta information om specifika datagrupper.

Detta avsnitt är ett av de mest betydelsefulla för en dataanalytiker eftersom det blir omöjligt att arbeta med data om den innehåller saknade värden eller är i fel format. Därför kommer du att lära dig hur man hanterar sådana olämpliga värden här.

DayOfWeek	Time
3	804.993130
4	804.452984
5	702.888362

Att bekanta sig med .groupby()-metoden