Pivot-taulukoiden Käsittely
Pythonissa on olemassa analoginen funktio .groupby()-menetelmälle, joka voi tuottaa saman lopputuloksen. Sinä päätät, kumpaa toimintoa käytät. Opitaan tämä esimerkin avulla. Käytämme seuraavaa funktiota, nimeltään .pivot_table(), ja laskemme sarakkeen 'Length' keskiarvot niille riveille, joilla sarakkeen 'Flight' arvo on sama:
123456789101112131415import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
Selitys:
data = pd.pivot_table(data, values = 'Length',
index = 'Flight',
aggfunc = 'mean')
pd.pivot_table()– funktio, joka luo pivot-taulukoita;data– käytettävä data frame;values = 'Length'– argumenttiinvaluesannetaan sarakkeet, joilla on sama ryhmä, ja joille lasketaan esimerkiksi keskiarvo, maksimi jne. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä ei ole merkitystä;index = 'Flight'–indexon argumentti, johon annetaan sarakkeen tai sarakkeiden nimi, joiden mukaan halutaan ryhmitellä. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä on merkitystä, kuten.groupby()-funktiossa;aggfunc = 'mean'– sama kuinagg.groupby()-menetelmässä,aggfunckäyttää täsmälleen samaa syntaksia kuinagg. Voit siis antaa useita funktioita laittamalla ne listaan ja määrittää funktiot eri sarakkeille käyttämällä aaltosulkuja.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain the difference between .groupby() and .pivot_table() in more detail?
What other aggregation functions can I use with .pivot_table()?
How can I group by multiple columns using .pivot_table()?
Awesome!
Completion rate improved to 3.03
Pivot-taulukoiden Käsittely
Pyyhkäise näyttääksesi valikon
Pythonissa on olemassa analoginen funktio .groupby()-menetelmälle, joka voi tuottaa saman lopputuloksen. Sinä päätät, kumpaa toimintoa käytät. Opitaan tämä esimerkin avulla. Käytämme seuraavaa funktiota, nimeltään .pivot_table(), ja laskemme sarakkeen 'Length' keskiarvot niille riveille, joilla sarakkeen 'Flight' arvo on sama:
123456789101112131415import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
Selitys:
data = pd.pivot_table(data, values = 'Length',
index = 'Flight',
aggfunc = 'mean')
pd.pivot_table()– funktio, joka luo pivot-taulukoita;data– käytettävä data frame;values = 'Length'– argumenttiinvaluesannetaan sarakkeet, joilla on sama ryhmä, ja joille lasketaan esimerkiksi keskiarvo, maksimi jne. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä ei ole merkitystä;index = 'Flight'–indexon argumentti, johon annetaan sarakkeen tai sarakkeiden nimi, joiden mukaan halutaan ryhmitellä. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä on merkitystä, kuten.groupby()-funktiossa;aggfunc = 'mean'– sama kuinagg.groupby()-menetelmässä,aggfunckäyttää täsmälleen samaa syntaksia kuinagg. Voit siis antaa useita funktioita laittamalla ne listaan ja määrittää funktiot eri sarakkeille käyttämällä aaltosulkuja.
Kiitos palautteestasi!