Familiarizando-se com o Método .groupby()
Fico feliz em vê-lo nesta seção. Aqui, agruparemos nossos dados para encontrar informações sobre diferentes grupos de linhas. Analise o conjunto de dados sobre atrasos (você pode rolar esta tabela horizontalmente):
Agrupar dados é benéfico, e agora vamos nos aprofundar nesse conceito. Imagine que você deseja calcular o número de atrasos para cada número de voo. Observe o exemplo de código e, em seguida, a explicação:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
Explicação:
data[['Flight', 'Delay']].groupby('Flight').sum()
data[['Flight', 'Delay']]- Estas são as colunas utilizadas, incluindo as colunas que serão agrupadas;groupby('Flight')- A coluna'Flight'é o argumento para a função.groupby(). Isso significa que as linhas com o mesmo valor na coluna'Flight'serão agrupadas;.sum()- Esta função opera nas linhas dentro de cada grupo criado pelo.groupby(). Neste caso, soma os valores da coluna'Delay'para as linhas que pertencem ao mesmo grupo de'Flight'.
Como a coluna 'Delay' contém apenas 0 (nenhum atraso ocorreu) ou 1 (um atraso ocorreu) como valores possíveis, a soma das linhas representa o número de atrasos para cada voo.
Na verdade, .sum() é uma das várias funções de agregação que podem ser utilizadas. Todas elas serão apresentadas ao longo do curso.
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Awesome!
Completion rate improved to 3.03
Familiarizando-se com o Método .groupby()
Deslize para mostrar o menu
Fico feliz em vê-lo nesta seção. Aqui, agruparemos nossos dados para encontrar informações sobre diferentes grupos de linhas. Analise o conjunto de dados sobre atrasos (você pode rolar esta tabela horizontalmente):
Agrupar dados é benéfico, e agora vamos nos aprofundar nesse conceito. Imagine que você deseja calcular o número de atrasos para cada número de voo. Observe o exemplo de código e, em seguida, a explicação:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
Explicação:
data[['Flight', 'Delay']].groupby('Flight').sum()
data[['Flight', 'Delay']]- Estas são as colunas utilizadas, incluindo as colunas que serão agrupadas;groupby('Flight')- A coluna'Flight'é o argumento para a função.groupby(). Isso significa que as linhas com o mesmo valor na coluna'Flight'serão agrupadas;.sum()- Esta função opera nas linhas dentro de cada grupo criado pelo.groupby(). Neste caso, soma os valores da coluna'Delay'para as linhas que pertencem ao mesmo grupo de'Flight'.
Como a coluna 'Delay' contém apenas 0 (nenhum atraso ocorreu) ou 1 (um atraso ocorreu) como valores possíveis, a soma das linhas representa o número de atrasos para cada voo.
Na verdade, .sum() é uma das várias funções de agregação que podem ser utilizadas. Todas elas serão apresentadas ao longo do curso.
Obrigado pelo seu feedback!