Pivot-taulukoiden Käsittely
Pythonissa on olemassa .groupby()
-menetelmän vastine, joka voi tuottaa saman tuloksen. On sinun päätettävissäsi, kumpaa toimintoa käytät. Opitaan tämä esimerkin avulla. Käyttämällä seuraavaa funktiota, nimeltään .pivot_table()
, lasketaan sarakkeen 'Length'
keskiarvot niille riveille, joilla sarakkeen 'Flight'
arvo on sama:
123456789101112131415import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
Selitys:
data = pd.pivot_table(data, values = 'Length',
index = 'Flight',
aggfunc = 'mean')
pd.pivot_table()
– funktio, joka luo pivot-taulukoita;data
– käytettävä data frame;values = 'Length'
– argumenttiinvalues
määritetään sarakkeet, joilla on sama ryhmä, joille lasketaan esimerkiksi keskiarvo, maksimi jne. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä ei ole merkitystä;index = 'Flight'
–index
on argumentti, johon määritetään sarakkeen tai sarakkeiden nimi, joiden mukaan halutaan ryhmitellä. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä on merkitystä, kuten.groupby()
-funktiossa;aggfunc = 'mean'
– sama kuinagg
.groupby()
-menetelmässä,aggfunc
käyttää täsmälleen samaa syntaksia kuinagg
. Voit siis määrittää useita funktioita laittamalla ne listaan ja määrittää funktiot eri sarakkeille käyttämällä aaltosulkuja.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain the difference between .groupby() and .pivot_table() in more detail?
What other aggregation functions can I use with .pivot_table()?
How can I group by multiple columns using .pivot_table()?
Awesome!
Completion rate improved to 3.03
Pivot-taulukoiden Käsittely
Pyyhkäise näyttääksesi valikon
Pythonissa on olemassa .groupby()
-menetelmän vastine, joka voi tuottaa saman tuloksen. On sinun päätettävissäsi, kumpaa toimintoa käytät. Opitaan tämä esimerkin avulla. Käyttämällä seuraavaa funktiota, nimeltään .pivot_table()
, lasketaan sarakkeen 'Length'
keskiarvot niille riveille, joilla sarakkeen 'Flight'
arvo on sama:
123456789101112131415import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
Selitys:
data = pd.pivot_table(data, values = 'Length',
index = 'Flight',
aggfunc = 'mean')
pd.pivot_table()
– funktio, joka luo pivot-taulukoita;data
– käytettävä data frame;values = 'Length'
– argumenttiinvalues
määritetään sarakkeet, joilla on sama ryhmä, joille lasketaan esimerkiksi keskiarvo, maksimi jne. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä ei ole merkitystä;index = 'Flight'
–index
on argumentti, johon määritetään sarakkeen tai sarakkeiden nimi, joiden mukaan halutaan ryhmitellä. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä on merkitystä, kuten.groupby()
-funktiossa;aggfunc = 'mean'
– sama kuinagg
.groupby()
-menetelmässä,aggfunc
käyttää täsmälleen samaa syntaksia kuinagg
. Voit siis määrittää useita funktioita laittamalla ne listaan ja määrittää funktiot eri sarakkeille käyttämällä aaltosulkuja.
Kiitos palautteestasi!