Sveip for å vise menyen

Python har en analog til .groupby()-metoden som kan gi samme resultat. Det er opp til deg hvilken funksjon du vil bruke. La oss lære dette ved hjelp av et eksempel. Ved å bruke følgende funksjon, kalt .pivot_table(), skal vi beregne gjennomsnittsverdiene i kolonnen 'Length' som har samme verdi i kolonnen 'Flight':


              123456789101112131415
            
import pandas as pd

data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)

# The code using .groupby()
data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean()
# The same code using .groupby()
data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean')

# The same code using .pivot_table()
data_flights_3 = pd.pivot_table(data, values = 'Length',
                      index = 'Flight',
                      aggfunc = 'mean')

print(data_flights_1.head())

Forklaring:

data = pd.pivot_table(data, values = 'Length',
                      index = 'Flight',
                      aggfunc = 'mean')

pd.pivot_table() - funksjon som lager pivottabeller;
data - dataframen som brukes;
values = 'Length' - til argumentet values tildeles kolonner med samme gruppe, hvor vi skal beregne gjennomsnitt, maksimum osv. Hvis du vil gruppere etter flere kolonner, legg dem i en liste; rekkefølgen er ikke viktig;
index = 'Flight' - index er et argument hvor du tildeler navnet på kolonnen eller kolonnene du vil gruppere etter. Hvis du vil gruppere etter flere kolonner, legg dem i en liste; rekkefølgen er viktig, som i .groupby()-funksjonen;
aggfunc = 'mean' - tilsvarer agg i .groupby()-metoden, aggfunc har nøyaktig samme syntaks som agg. Du kan derfor legge til flere funksjoner her ved å legge dem i en liste, for å spesifisere funksjoner for ulike kolonner ved å bruke krøllparenteser.

Her er et eksempel på kode som bruker .groupby()-setningen. Velg det tilsvarende eksempelet som bruker funksjonen .pivot_table().

Velg det helt riktige svaret

data_flights = pd.pivot_table(data, 
    values = ['AirportFrom', 'AirportTo'],
    index = ['Length', 'Time'],
    aggfunc = 'min'
)

data_flights = pd.pivot_table(data, 
    values = ['AirportTo', 'AirportFrom'],
    index = ['Length', 'Time'],
    aggfunc = 'mean'
)

data_flights = pd.pivot_table(data, 
    values = 'AirportTo', 'AirportFrom',
    index = ['Length', 'Time'],
    aggfunc = 'min'
)

Alt var klart?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 5

Spør AI

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Håndtering av pivottabeller


              123456789101112131415
            
import pandas as pd

data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)

# The code using .groupby()
data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean()
# The same code using .groupby()
data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean')

# The same code using .pivot_table()
data_flights_3 = pd.pivot_table(data, values = 'Length',
                      index = 'Flight',
                      aggfunc = 'mean')

print(data_flights_1.head())

Forklaring:

data = pd.pivot_table(data, values = 'Length',
                      index = 'Flight',
                      aggfunc = 'mean')

pd.pivot_table() - funksjon som lager pivottabeller;
data - dataframen som brukes;
values = 'Length' - til argumentet values tildeles kolonner med samme gruppe, hvor vi skal beregne gjennomsnitt, maksimum osv. Hvis du vil gruppere etter flere kolonner, legg dem i en liste; rekkefølgen er ikke viktig;
index = 'Flight' - index er et argument hvor du tildeler navnet på kolonnen eller kolonnene du vil gruppere etter. Hvis du vil gruppere etter flere kolonner, legg dem i en liste; rekkefølgen er viktig, som i .groupby()-funksjonen;
aggfunc = 'mean' - tilsvarer agg i .groupby()-metoden, aggfunc har nøyaktig samme syntaks som agg. Du kan derfor legge til flere funksjoner her ved å legge dem i en liste, for å spesifisere funksjoner for ulike kolonner ved å bruke krøllparenteser.

Alt var klart?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 5