Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Avanserte Polars-transformasjoner | Effektiv Datamanipulering med Polars
Håndtering av Store Data med Python

Avanserte Polars-transformasjoner

Sveip for å vise menyen

Når du arbeider med store datasett, må du ofte oppsummere eller analysere data etter grupper. I polars er metodene groupby og aggregering utviklet for høy ytelse, slik at du effektivt kan beregne statistikk selv på svært store datamengder. Groupby-operasjoner lar deg dele opp dataene i grupper basert på én eller flere kolonner, og deretter bruke funksjoner som sum, mean eller count på hver gruppe. Dette er spesielt nyttig for oppgaver som å finne gjennomsnittlig salg per region, totalt antall solgte varer per kategori, eller maksimal verdi i hver gruppe.

Polars utmerker seg fordi det er optimalisert for parallell utførelse, slik at groupby-operasjoner er mye raskere sammenlignet med mange andre dataverktøy. Du kan raskt aggregere millioner av rader uten problemer med minne eller hastighet. Syntaksen er også kortfattet og uttrykksfull, noe som gjør koden lett å lese og vedlikeholde.

Anta at du har et datasett med salgsoppføringer, og du ønsker å finne totalt og gjennomsnittlig salg for hver produktkategori. Med polars kan du oppnå dette med bare noen få linjer kode.

12345678910111213141516171819
import polars as pl # Create a sample DataFrame df = pl.DataFrame({ "category": ["A", "A", "B", "B", "C", "A"], "sales": [100, 150, 200, 120, 300, 180] }) # Group by 'category' and aggregate total and average sales result = ( df.groupby("category") .agg([ pl.col("sales").sum().alias("total_sales"), pl.col("sales").mean().alias("average_sales") ]) ) print(result)

Koden over grupperer salgsdataene etter category, og beregner deretter både totalt og gjennomsnittlig salg for hver gruppe. Denne tilnærmingen er ikke bare kortfattet, men også svært effektiv, noe som gjør den praktisk for virkelige datasett som kan være mye større enn eksempelet.

Polars støtter et bredt utvalg av aggregeringsfunksjoner, som min, max, count og egendefinerte uttrykk, slik at du kan tilpasse analysen etter behov. Siden polars er utviklet med ytelse i fokus, kan du stole på at det håndterer groupby- og aggregeringsoppgaver raskt, selv når datamengden øker.

question mark

Hva er en viktig fordel med groupby-operasjoner i polars?

Velg det helt riktige svaret

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 3. Kapittel 3

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Seksjon 3. Kapittel 3
some-alt