Group_by og aggregeringer
Sveip for å vise menyen
Gruppering og aggregering av data er en sentral del av datahåndtering, spesielt når du ønsker å oppsummere informasjon etter kategorier. Med Polars kan du effektivt utføre group-by-operasjoner og aggregere resultater parallelt, noe som gjør det ideelt for store datasett. Anta at du har en DataFrame kalt games_df med kolonner som developer, price, positive_reviews og negative_reviews. Du kan for eksempel ønske å finne gjennomsnittspris og totalt antall anmeldelser for hver utvikler. I Polars kan dette gjøres ved å bruke metoden group_by, etterfulgt av aggregeringsfunksjoner som mean og sum.
Slik kan du gruppere games_df etter kolonnen developer, beregne gjennomsnittspris og summere totalt antall anmeldelser (kombinert positive og negative anmeldelser):
123456789101112131415161718192021import polars as pl # Sample data games_df = pl.DataFrame({ "developer": ["DevA", "DevB", "DevA", "DevC", "DevB"], "price": [10.0, 20.0, 15.0, 30.0, 25.0], "positive_reviews": [100, 150, 200, 80, 120], "negative_reviews": [10, 20, 15, 5, 8] }) # Group by developer, calculate average price and total reviews result = ( games_df .group_by("developer") .agg([ pl.col("price").mean().alias("avg_price"), (pl.col("positive_reviews") + pl.col("negative_reviews")).sum().alias("total_reviews") ]) ) print(result)
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår