Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Pivot-taulukoiden Käsittely | Datan Yhdistäminen
Edistyneet Tekniikat Pandas-Kirjastossa

bookPivot-taulukoiden Käsittely

Pythonissa on olemassa .groupby()-menetelmän vastine, joka voi tuottaa saman tuloksen. On sinun päätettävissäsi, kumpaa toimintoa käytät. Opitaan tämä esimerkin avulla. Käyttämällä seuraavaa funktiota, nimeltään .pivot_table(), lasketaan sarakkeen 'Length' keskiarvot niille riveille, joilla sarakkeen 'Flight' arvo on sama:

123456789101112131415
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
copy

Selitys:

data = pd.pivot_table(data, values = 'Length',
                      index = 'Flight',
                      aggfunc = 'mean')
  • pd.pivot_table() – funktio, joka luo pivot-taulukoita;
  • data – käytettävä data frame;
  • values = 'Length' – argumenttiin values määritetään sarakkeet, joilla on sama ryhmä, joille lasketaan esimerkiksi keskiarvo, maksimi jne. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä ei ole merkitystä;
  • index = 'Flight'index on argumentti, johon määritetään sarakkeen tai sarakkeiden nimi, joiden mukaan halutaan ryhmitellä. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä on merkitystä, kuten .groupby()-funktiossa;
  • aggfunc = 'mean' – sama kuin agg .groupby()-menetelmässä, aggfunc käyttää täsmälleen samaa syntaksia kuin agg. Voit siis määrittää useita funktioita laittamalla ne listaan ja määrittää funktiot eri sarakkeille käyttämällä aaltosulkuja.
question mark

Tässä on esimerkki koodista, joka käyttää .groupby()-lausetta. Valitse vastaava esimerkki, jossa käytetään .pivot_table()-funktiota.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 5

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain the difference between .groupby() and .pivot_table() in more detail?

What other aggregation functions can I use with .pivot_table()?

How can I group by multiple columns using .pivot_table()?

Awesome!

Completion rate improved to 3.03

bookPivot-taulukoiden Käsittely

Pyyhkäise näyttääksesi valikon

Pythonissa on olemassa .groupby()-menetelmän vastine, joka voi tuottaa saman tuloksen. On sinun päätettävissäsi, kumpaa toimintoa käytät. Opitaan tämä esimerkin avulla. Käyttämällä seuraavaa funktiota, nimeltään .pivot_table(), lasketaan sarakkeen 'Length' keskiarvot niille riveille, joilla sarakkeen 'Flight' arvo on sama:

123456789101112131415
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
copy

Selitys:

data = pd.pivot_table(data, values = 'Length',
                      index = 'Flight',
                      aggfunc = 'mean')
  • pd.pivot_table() – funktio, joka luo pivot-taulukoita;
  • data – käytettävä data frame;
  • values = 'Length' – argumenttiin values määritetään sarakkeet, joilla on sama ryhmä, joille lasketaan esimerkiksi keskiarvo, maksimi jne. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä ei ole merkitystä;
  • index = 'Flight'index on argumentti, johon määritetään sarakkeen tai sarakkeiden nimi, joiden mukaan halutaan ryhmitellä. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä on merkitystä, kuten .groupby()-funktiossa;
  • aggfunc = 'mean' – sama kuin agg .groupby()-menetelmässä, aggfunc käyttää täsmälleen samaa syntaksia kuin agg. Voit siis määrittää useita funktioita laittamalla ne listaan ja määrittää funktiot eri sarakkeille käyttämällä aaltosulkuja.
question mark

Tässä on esimerkki koodista, joka käyttää .groupby()-lausetta. Valitse vastaava esimerkki, jossa käytetään .pivot_table()-funktiota.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 5
some-alt