Summary  
The pandas .groupby() method groups DataFrame rows by the values in a specified column and lets you apply aggregation functions (e.g., mean, sum, count, min, max, median) to compute summary statistics for each group.

General domain of usage  
Airline flight delay analysis

Watch this video for a visual and auditory walkthrough of the `.groupby()` method in pandas. You will see how to group data by columns, apply aggregation functions like `.sum()` and `.mean()`, and interpret the results using the flight delay dataset. The video reinforces the code examples and table explanations you have just learned, making the grouping and aggregation process clear and practical.

Sono lieto di vederti in questa sezione. Qui raggrupperemo i nostri dati per trovare informazioni su diversi gruppi di righe. Esamina il set di dati sui ritardi (puoi scorrere questa tabella orizzontalmente):


Raggruppare i dati è utile e ora lo approfondiremo ulteriormente. Immagina di voler calcolare il numero di ritardi per ogni numero di volo. Osserva l'esempio di codice e poi la spiegazione:

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)
data_flights = data[['Flight', 'Delay']].groupby('Flight').sum()
print(data_flights.head())

**Spiegazione:**

```python
data[['Flight', 'Delay']].groupby('Flight').sum()
```

- `data[['Flight', 'Delay']]` - Queste sono le colonne su cui si lavora, incluse quelle su cui si effettua il raggruppamento;
- `groupby('Flight')` - La colonna `'Flight'` è l'argomento della funzione `.groupby()`. Questo significa che le righe con lo stesso valore nella colonna `'Flight'` verranno raggruppate insieme;
- `.sum()` - Questa funzione opera sulle righe all'interno di ciascun gruppo creato da `.groupby()`. In questo caso, somma i valori nella colonna `'Delay'` per le righe che appartengono allo stesso gruppo `'Flight'`.

Poiché la colonna `'Delay'` contiene solo `0` (nessun ritardo) o `1` (si è verificato un ritardo) come possibili valori, la somma delle righe rappresenta il numero di ritardi per ciascun volo.

Nota

In realtà, `.sum()` è una delle molte funzioni di aggregazione che puoi utilizzare. Le conoscerai tutte man mano che proseguirai.

Questo corso contiene molte funzioni utili per un futuro data analyst. Imparerai diversi modi per estrarre dati e persino impostare condizioni su di essi. Successivamente, conoscerai i metodi di raggruppamento dei dati. Inoltre, apprenderai come preprocessare i dati. Ogni sezione ha il proprio set di dati, rendendo il corso coinvolgente.

Questa sezione ti insegnerà come visualizzare colonne specifiche in base ai loro titoli o indici. Inoltre, verranno illustrate le modalità per selezionare le righe tramite gli indici.

Qui imparerai come estrarre dati che soddisfano condizioni specifiche. Inoltre, imparerai come combinarle e persino crearne di proprie.

In questa sezione, amplierai le tue conoscenze sull'impostazione di diverse condizioni sui dati. Imparerai a verificare se i tuoi dati sono presenti in un elenco definito di valori o compresi tra due valori. Imparerai anche come trovare i valori più grandi e più piccoli.

Questa sezione è una delle più affascinanti del corso. Qui imparerai come raggruppare i dati in diversi modi. Ti aiuterà a lavorare come data analyst per individuare informazioni su specifici gruppi di dati.

Questa sezione è una delle più significative per un data analyst perché, se i dati contengono valori mancanti o in un formato errato, sarà impossibile lavorarci. Pertanto, qui imparerai come gestire tali valori inappropriati.

DayOfWeek	Time
3	804.993130
4	804.452984
5	702.888362

Familiarizzarsi con il metodo .groupby()