Avancerede Polars-Transformationer
Stryg for at vise menuen
Når du arbejder med store datasæt, har du ofte brug for at opsummere eller analysere data efter grupper. I polars er groupby- og aggregeringsmetoderne designet til høj ydeevne, så du effektivt kan beregne statistikker selv på meget store datamængder. Groupby-operationer gør det muligt at opdele dine data i grupper baseret på en eller flere kolonner og derefter anvende funktioner som sum, mean eller count på hver gruppe. Dette er især nyttigt til opgaver som at finde gennemsnitligt salg pr. region, det samlede antal solgte varer pr. kategori eller den maksimale værdi i hver gruppe.
Polars skiller sig ud, fordi det er optimeret til parallel eksekvering, så groupby-operationer er meget hurtigere sammenlignet med mange andre datalibraries. Du kan hurtigt aggregere millioner af rækker uden at støde på problemer med hukommelse eller hastighed. Syntaksen er også kortfattet og udtryksfuld, hvilket gør din kode let at læse og vedligeholde.
Antag, at du har et datasæt med salgsoptegnelser, og du ønsker at finde det samlede og gennemsnitlige salg for hver produktkategori. Med polars kan du opnå dette med blot få linjer kode.
12345678910111213141516171819import polars as pl # Create a sample DataFrame df = pl.DataFrame({ "category": ["A", "A", "B", "B", "C", "A"], "sales": [100, 150, 200, 120, 300, 180] }) # Group by 'category' and aggregate total and average sales result = ( df.groupby("category") .agg([ pl.col("sales").sum().alias("total_sales"), pl.col("sales").mean().alias("average_sales") ]) ) print(result)
Koden ovenfor grupperer salgsdataene efter category og beregner derefter både det samlede og gennemsnitlige salg for hver gruppe. Denne tilgang er ikke kun kortfattet, men også meget effektiv, hvilket gør den praktisk til virkelige datasæt, der kan være meget større end eksemplet.
Polars understøtter et bredt udvalg af aggregeringsfunktioner såsom min, max, count og brugerdefinerede udtryk, så du kan tilpasse din analyse efter behov. Fordi polars er designet med fokus på ydeevne, kan du stole på, at det håndterer groupby- og aggregeringsopgaver hurtigt, selv når dine data vokser.
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat