Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Group_by og aggregeringer | Kombinering, aggregering
Data Wrangling med Polars

Group_by og aggregeringer

Sveip for å vise menyen

Gruppering og aggregering av data er en sentral del av datahåndtering, spesielt når du ønsker å oppsummere informasjon etter kategorier. Med Polars kan du effektivt utføre group-by-operasjoner og aggregere resultater parallelt, noe som gjør det ideelt for store datasett. Anta at du har en DataFrame kalt games_df med kolonner som developer, price, positive_reviews og negative_reviews. Du kan for eksempel ønske å finne gjennomsnittspris og totalt antall anmeldelser for hver utvikler. I Polars kan dette gjøres ved å bruke metoden group_by, etterfulgt av aggregeringsfunksjoner som mean og sum.

Slik kan du gruppere games_df etter kolonnen developer, beregne gjennomsnittspris og summere totalt antall anmeldelser (kombinert positive og negative anmeldelser):

123456789101112131415161718192021
import polars as pl # Sample data games_df = pl.DataFrame({ "developer": ["DevA", "DevB", "DevA", "DevC", "DevB"], "price": [10.0, 20.0, 15.0, 30.0, 25.0], "positive_reviews": [100, 150, 200, 80, 120], "negative_reviews": [10, 20, 15, 5, 8] }) # Group by developer, calculate average price and total reviews result = ( games_df .group_by("developer") .agg([ pl.col("price").mean().alias("avg_price"), (pl.col("positive_reviews") + pl.col("negative_reviews")).sum().alias("total_reviews") ]) ) print(result)
question mark

Hvilken Polars-metode lar deg gruppere en DataFrame etter en kolonne og utføre aggregeringer?

Velg det helt riktige svaret

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 1

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Seksjon 2. Kapittel 1
some-alt