Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Group_by ja Aggregoinnit | Yhdistäminen, Aggregointi
Datan Käsittely Polarsilla

Group_by ja Aggregoinnit

Pyyhkäise näyttääksesi valikon

Tietojen ryhmittely ja aggregointi on keskeinen osa datan käsittelyä, erityisesti kun halutaan tiivistää tietoa kategorioittain. Polarsin avulla ryhmittely- ja aggregaatiotoiminnot voidaan suorittaa tehokkaasti rinnakkain, mikä tekee siitä ihanteellisen suurille aineistoille. Oletetaan, että käytössä on DataFrame nimeltä games_df, jossa on sarakkeet kuten developer, price, positive_reviews ja negative_reviews. Saatat haluta selvittää kunkin kehittäjän keskimääräisen hinnan ja arvostelujen kokonaismäärän. Polarsissa tämä onnistuu käyttämällä group_by-metodia ja aggregaatiotoimintoja, kuten mean ja sum.

Alla esimerkki, jossa games_df ryhmitellään developer-sarakkeen mukaan, lasketaan keskimääräinen hinta ja summataan arvostelujen kokonaismäärä (sekä positiiviset että negatiiviset arvostelut yhdistettynä):

123456789101112131415161718192021
import polars as pl # Sample data games_df = pl.DataFrame({ "developer": ["DevA", "DevB", "DevA", "DevC", "DevB"], "price": [10.0, 20.0, 15.0, 30.0, 25.0], "positive_reviews": [100, 150, 200, 80, 120], "negative_reviews": [10, 20, 15, 5, 8] }) # Group by developer, calculate average price and total reviews result = ( games_df .group_by("developer") .agg([ pl.col("price").mean().alias("avg_price"), (pl.col("positive_reviews") + pl.col("negative_reviews")).sum().alias("total_reviews") ]) ) print(result)
question mark

Mikä Polars-metodi mahdollistaa DataFramen ryhmittelyn sarakkeen perusteella ja aggregaatioiden suorittamisen?

Valitse oikea vastaus

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 1

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 2. Luku 1
some-alt