Summary  
The pandas .groupby() method groups DataFrame rows by the values in a specified column and lets you apply aggregation functions (e.g., mean, sum, count, min, max, median) to compute summary statistics for each group.

General domain of usage  
Airline flight delay analysis

Watch this video for a visual and auditory walkthrough of the `.groupby()` method in pandas. You will see how to group data by columns, apply aggregation functions like `.sum()` and `.mean()`, and interpret the results using the flight delay dataset. The video reinforces the code examples and table explanations you have just learned, making the grouping and aggregation process clear and practical.

Hyggelig å se deg i denne delen. Her skal vi gruppere dataene våre for å finne informasjon om ulike grupper av rader. Undersøk datasettet om forsinkelser (du kan bla horisontalt i denne tabellen):


Å gruppere data er nyttig, og nå skal vi se nærmere på dette. Tenk deg at du vil beregne antall forsinkelser for hvert flynummer. Se på kodeeksempelet og deretter på forklaringen:

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)
data_flights = data[['Flight', 'Delay']].groupby('Flight').sum()
print(data_flights.head())

**Forklaring:**

```python
data[['Flight', 'Delay']].groupby('Flight').sum()
```

- `data[['Flight', 'Delay']]` – Dette er kolonnene du skal arbeide med, inkludert kolonnene du skal gruppere;
- `groupby('Flight')` – Kolonnen `'Flight'` er argumentet for `.groupby()`-funksjonen. Dette betyr at rader med samme verdi i `'Flight'`-kolonnen blir gruppert sammen;
- `.sum()` – Denne funksjonen opererer på radene innenfor hver gruppe opprettet av `.groupby()`. I dette tilfellet summeres verdiene i `'Delay'`-kolonnen for rader som tilhører samme `'Flight'`-gruppe.

Siden `'Delay'`-kolonnen kun inneholder `0` (ingen forsinkelse) eller `1` (forsinkelse) som mulige verdier, representerer summen av radene antall forsinkelser for hver flight.

Merk

Faktisk er `.sum()` én av mange aggregeringsfunksjoner du kan bruke. Du vil bli kjent med alle etter hvert som du fortsetter.

Dette kurset inneholder mange nyttige funksjoner for en fremtidig dataanalytiker. Du vil lære ulike måter å hente ut data på og til og med sette betingelser for dem. Etter dette vil du bli kjent med metoder for å gruppere data. Du vil også lære hvordan du forhåndsbehandler data. Hver seksjon har sitt eget datasett, noe som gjør kurset engasjerende.

Denne seksjonen vil lære deg hvordan du kan hente ut spesifikke kolonner ved hjelp av titler eller indekser. Du vil også bli kjent med ulike måter å velge rader basert på indekser.

Her vil du lære hvordan du kan hente ut data som oppfyller spesifikke betingelser. Du vil også lære hvordan du kan kombinere dem og til og med lage dine egne.

I denne delen vil du utvide kunnskapen din om å sette ulike datakriterier. Du vil lære å sjekke om dataene dine finnes i en definert liste med verdier eller mellom to verdier. Du vil også lære hvordan du finner de største og minste verdiene.

Denne seksjonen er en av de mest fascinerende i kurset. Her vil du lære hvordan du kan gruppere data på ulike måter. Dette vil hjelpe deg som dataanalytiker med å finne informasjon om spesifikke datagrupper.

Denne seksjonen er en av de viktigste for en dataanalytiker fordi det vil være umulig å arbeide med dataene dersom de inneholder manglende verdier eller feil format. Derfor vil du lære hvordan du håndterer slike upassende verdier her.

DayOfWeek	Time
3	804.993130
4	804.452984
5	702.888362

Bli Kjent Med .groupby()-Metoden

Bli Kjent Med .groupby()-Metoden