Pivot-taulukoiden Käsittely
Pyyhkäise näyttääksesi valikon
Pythonissa on olemassa analoginen funktio .groupby()-menetelmälle, joka voi tuottaa saman lopputuloksen. Sinä päätät, kumpaa toimintoa käytät. Opitaan tämä esimerkin avulla. Käytämme seuraavaa funktiota, nimeltään .pivot_table(), ja laskemme sarakkeen 'Length' keskiarvot niille riveille, joilla sarakkeen 'Flight' arvo on sama:
123456789101112131415import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
Selitys:
data = pd.pivot_table(data, values = 'Length',
index = 'Flight',
aggfunc = 'mean')
pd.pivot_table()– funktio, joka luo pivot-taulukoita;data– käytettävä data frame;values = 'Length'– argumenttiinvaluesannetaan sarakkeet, joilla on sama ryhmä, ja joille lasketaan esimerkiksi keskiarvo, maksimi jne. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä ei ole merkitystä;index = 'Flight'–indexon argumentti, johon annetaan sarakkeen tai sarakkeiden nimi, joiden mukaan halutaan ryhmitellä. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä on merkitystä, kuten.groupby()-funktiossa;aggfunc = 'mean'– sama kuinagg.groupby()-menetelmässä,aggfunckäyttää täsmälleen samaa syntaksia kuinagg. Voit siis antaa useita funktioita laittamalla ne listaan ja määrittää funktiot eri sarakkeille käyttämällä aaltosulkuja.
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 4. Luku 5
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Osio 4. Luku 5