Avanserte Polars-transformasjoner
Sveip for å vise menyen
Når du arbeider med store datasett, må du ofte oppsummere eller analysere data etter grupper. I polars er metodene groupby og aggregering utviklet for høy ytelse, slik at du effektivt kan beregne statistikk selv på svært store datamengder. Groupby-operasjoner lar deg dele opp dataene i grupper basert på én eller flere kolonner, og deretter bruke funksjoner som sum, mean eller count på hver gruppe. Dette er spesielt nyttig for oppgaver som å finne gjennomsnittlig salg per region, totalt antall solgte varer per kategori, eller maksimal verdi i hver gruppe.
Polars utmerker seg fordi det er optimalisert for parallell utførelse, slik at groupby-operasjoner er mye raskere sammenlignet med mange andre dataverktøy. Du kan raskt aggregere millioner av rader uten problemer med minne eller hastighet. Syntaksen er også kortfattet og uttrykksfull, noe som gjør koden lett å lese og vedlikeholde.
Anta at du har et datasett med salgsoppføringer, og du ønsker å finne totalt og gjennomsnittlig salg for hver produktkategori. Med polars kan du oppnå dette med bare noen få linjer kode.
12345678910111213141516171819import polars as pl # Create a sample DataFrame df = pl.DataFrame({ "category": ["A", "A", "B", "B", "C", "A"], "sales": [100, 150, 200, 120, 300, 180] }) # Group by 'category' and aggregate total and average sales result = ( df.groupby("category") .agg([ pl.col("sales").sum().alias("total_sales"), pl.col("sales").mean().alias("average_sales") ]) ) print(result)
Koden over grupperer salgsdataene etter category, og beregner deretter både totalt og gjennomsnittlig salg for hver gruppe. Denne tilnærmingen er ikke bare kortfattet, men også svært effektiv, noe som gjør den praktisk for virkelige datasett som kan være mye større enn eksempelet.
Polars støtter et bredt utvalg av aggregeringsfunksjoner, som min, max, count og egendefinerte uttrykk, slik at du kan tilpasse analysen etter behov. Siden polars er utviklet med ytelse i fokus, kan du stole på at det håndterer groupby- og aggregeringsoppgaver raskt, selv når datamengden øker.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår