Summary  
The pandas .groupby() method groups DataFrame rows by the values in a specified column and lets you apply aggregation functions (e.g., mean, sum, count, min, max, median) to compute summary statistics for each group.

General domain of usage  
Airline flight delay analysis

Watch this video for a visual and auditory walkthrough of the `.groupby()` method in pandas. You will see how to group data by columns, apply aggregation functions like `.sum()` and `.mean()`, and interpret the results using the flight delay dataset. The video reinforces the code examples and table explanations you have just learned, making the grouping and aggregation process clear and practical.

Fico feliz em ver você nesta seção. Aqui, vamos agrupar nossos dados para encontrar informações sobre diferentes grupos de linhas. Examine o conjunto de dados sobre atrasos (você pode rolar esta tabela horizontalmente):


Agrupar dados é benéfico, e agora vamos nos aprofundar nesse conceito. Imagine que você deseja calcular o número de atrasos para cada número de voo. Observe o exemplo de código e, em seguida, a explicação:

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)
data_flights = data[['Flight', 'Delay']].groupby('Flight').sum()
print(data_flights.head())

**Explicação:**

```python
data[['Flight', 'Delay']].groupby('Flight').sum()
```

- `data[['Flight', 'Delay']]` - Estas são as colunas utilizadas, incluindo as colunas que serão agrupadas;
- `groupby('Flight')` - A coluna `'Flight'` é o argumento para a função `.groupby()`. Isso significa que as linhas com o mesmo valor na coluna `'Flight'` serão agrupadas;
- `.sum()` - Esta função opera nas linhas dentro de cada grupo criado pelo `.groupby()`. Neste caso, soma os valores da coluna `'Delay'` para as linhas que pertencem ao mesmo grupo de `'Flight'`.

Como a coluna `'Delay'` contém apenas `0` (nenhum atraso ocorreu) ou `1` (um atraso ocorreu) como valores possíveis, a soma das linhas representa o número de atrasos para cada voo.

Nota

Na verdade, `.sum()` é uma das várias funções de agregação que podem ser utilizadas. Todas elas serão apresentadas ao longo do curso.

Este curso contém diversas funções úteis para um futuro analista de dados. Você aprenderá diferentes formas de extrair dados e até mesmo definir condições sobre eles. Após isso, estará familiarizado com os métodos de agrupamento de dados. Além disso, você aprenderá como pré-processar dados. Cada seção possui seu próprio conjunto de dados, tornando o curso envolvente.

Esta seção ensinará como exibir colunas específicas pelos seus títulos ou índices. Além disso, você se familiarizará com as formas de selecionar linhas por índices.

Aqui, você aprenderá como extrair dados que possuem condições específicas. Além disso, você aprenderá como combiná-las e até mesmo criar as suas próprias.

Nesta seção, você expandirá seu conhecimento sobre como definir diferentes condições de dados. Você aprenderá a verificar se seus dados estão em uma lista definida de valores ou entre dois valores. Você também aprenderá a encontrar os maiores e menores valores.

Esta seção é uma das mais fascinantes do curso. Aqui, você aprenderá como agrupar dados de diferentes maneiras. Isso ajudará no trabalho como analista de dados para obter informações sobre grupos de dados específicos.

Esta seção é uma das mais significativas para um analista de dados, pois, se os dados contiverem valores ausentes ou em formato incorreto, será impossível trabalhar com eles. Assim, você aprenderá como lidar com esses valores inadequados aqui.

DayOfWeek	Time
3	804.993130
4	804.452984
5	702.888362

Familiarizando-se com o Método .groupby()