Hantering av Pivottabeller
Python har en motsvarighet till metoden .groupby()
som kan ge samma resultat. Det är upp till dig vilken funktion du vill använda. Låt oss lära oss detta genom ett exempel. Med hjälp av följande funktion, kallad .pivot_table()
, kommer vi att beräkna medelvärdena för kolumnen 'Length'
som har samma värde i kolumnen 'Flight'
:
123456789101112131415import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
Förklaring:
data = pd.pivot_table(data, values = 'Length',
index = 'Flight',
aggfunc = 'mean')
pd.pivot_table()
– funktion som skapar pivottabeller;data
– data frame som används;values = 'Length'
– till argumentetvalues
tilldelas kolumner med samma grupp, för vilka vi kommer att tillämpa beräkning av medelvärde, maxvärde, etc. Om du vill gruppera efter flera kolumner, lägg dem i en lista; ordningen är inte avgörande;index = 'Flight'
–index
är ett argument där du anger namnet på en kolumn eller kolumner som du vill gruppera efter. Om du vill gruppera efter flera kolumner, lägg dem i en lista; ordningen är avgörande, precis som i funktionen.groupby()
;aggfunc = 'mean'
– samma somagg
i metoden.groupby()
,aggfunc
har exakt samma syntax somagg
. Du kan alltså ange flera funktioner här genom att lägga dem i en lista för att specificera funktioner för olika kolumner med hjälp av klamrar.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.03
Hantering av Pivottabeller
Svep för att visa menyn
Python har en motsvarighet till metoden .groupby()
som kan ge samma resultat. Det är upp till dig vilken funktion du vill använda. Låt oss lära oss detta genom ett exempel. Med hjälp av följande funktion, kallad .pivot_table()
, kommer vi att beräkna medelvärdena för kolumnen 'Length'
som har samma värde i kolumnen 'Flight'
:
123456789101112131415import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
Förklaring:
data = pd.pivot_table(data, values = 'Length',
index = 'Flight',
aggfunc = 'mean')
pd.pivot_table()
– funktion som skapar pivottabeller;data
– data frame som används;values = 'Length'
– till argumentetvalues
tilldelas kolumner med samma grupp, för vilka vi kommer att tillämpa beräkning av medelvärde, maxvärde, etc. Om du vill gruppera efter flera kolumner, lägg dem i en lista; ordningen är inte avgörande;index = 'Flight'
–index
är ett argument där du anger namnet på en kolumn eller kolumner som du vill gruppera efter. Om du vill gruppera efter flera kolumner, lägg dem i en lista; ordningen är avgörande, precis som i funktionen.groupby()
;aggfunc = 'mean'
– samma somagg
i metoden.groupby()
,aggfunc
har exakt samma syntax somagg
. Du kan alltså ange flera funktioner här genom att lägga dem i en lista för att specificera funktioner för olika kolumner med hjälp av klamrar.
Tack för dina kommentarer!