Impara Group_by e Aggregazioni | Combinazione, Aggregazione

Scorri per mostrare il menu

Raggruppare e aggregare i dati è una parte fondamentale del data wrangling, soprattutto quando si desidera riassumere le informazioni per categoria. Con Polars, è possibile eseguire operazioni di group-by e aggregare i risultati in parallelo in modo efficiente, rendendolo ideale per dataset di grandi dimensioni. Supponiamo di avere un DataFrame chiamato games_df con colonne come developer, price, positive_reviews e negative_reviews. Potresti voler trovare il prezzo medio e il totale delle recensioni per ogni sviluppatore. In Polars, questo può essere fatto utilizzando il metodo group_by, seguito da funzioni di aggregazione come mean e sum.

Ecco come raggruppare games_df per la colonna developer, calcolare il prezzo medio e sommare il totale delle recensioni (combinando sia le recensioni positive che quelle negative):


              123456789101112131415161718192021
            
import polars as pl

# Sample data
games_df = pl.DataFrame({
    "developer": ["DevA", "DevB", "DevA", "DevC", "DevB"],
    "price": [10.0, 20.0, 15.0, 30.0, 25.0],
    "positive_reviews": [100, 150, 200, 80, 120],
    "negative_reviews": [10, 20, 15, 5, 8]
})

# Group by developer, calculate average price and total reviews
result = (
    games_df
    .group_by("developer")
    .agg([
        pl.col("price").mean().alias("avg_price"),
        (pl.col("positive_reviews") + pl.col("negative_reviews")).sum().alias("total_reviews")
    ])
)

print(result)

Tutto è chiaro?

Grazie per i tuoi commenti!

Sezione 2. Capitolo 1

Chieda ad AI

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Sezione 2. Capitolo 1