Trasformazioni Avanzate con Polars
Scorri per mostrare il menu
Quando si lavora con grandi set di dati, spesso è necessario riassumere o analizzare i dati per gruppi. In polars, i metodi groupby e di aggregazione sono progettati per alte prestazioni, permettendo di calcolare statistiche in modo efficiente anche su dati di grandi dimensioni. Le operazioni di groupby consentono di suddividere i dati in gruppi in base a una o più colonne e poi applicare funzioni come sum, mean o count a ciascun gruppo. Questo è particolarmente utile per attività come trovare la media delle vendite per regione, il numero totale di articoli venduti per categoria o il valore massimo in ogni gruppo.
Polars si distingue perché è ottimizzato per l'esecuzione parallela, quindi le operazioni di groupby sono molto più veloci rispetto a molte altre librerie di dati. È possibile aggregare rapidamente milioni di righe senza problemi di memoria o velocità. Anche la sintassi è concisa ed espressiva, rendendo il codice facile da leggere e mantenere.
Supponiamo di avere un set di dati contenente registrazioni di vendite e di voler trovare il totale e la media delle vendite per ogni categoria di prodotto. Con polars, è possibile ottenere questo risultato con poche righe di codice.
12345678910111213141516171819import polars as pl # Create a sample DataFrame df = pl.DataFrame({ "category": ["A", "A", "B", "B", "C", "A"], "sales": [100, 150, 200, 120, 300, 180] }) # Group by 'category' and aggregate total and average sales result = ( df.groupby("category") .agg([ pl.col("sales").sum().alias("total_sales"), pl.col("sales").mean().alias("average_sales") ]) ) print(result)
Il codice sopra raggruppa i dati delle vendite per category, quindi calcola sia il totale che la media delle vendite per ogni gruppo. Questo approccio non è solo conciso ma anche altamente efficiente, rendendolo pratico per set di dati reali che possono essere molto più grandi dell'esempio.
Polars supporta un'ampia gamma di funzioni di aggregazione, come min, max, count ed espressioni personalizzate, permettendo di adattare l'analisi alle proprie esigenze. Poiché polars è progettato con un'attenzione particolare alle prestazioni, è affidabile per gestire rapidamente operazioni di groupby e aggregazione anche con l'aumentare dei dati.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione