Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Polars Dataaggregering | Effektiv Datamanipulation med Polars
Håndtering af Store Datamængder med Python
Sektion 3. Kapitel 4
single

single

Udfordring: Polars Dataaggregering

Stryg for at vise menuen

I denne udfordring skal du bruge polars til effektivt at udføre dataaggregering på store datasæt. Opgaven består i at gruppere en stor DataFrame efter én kolonne og beregne gennemsnittet af en anden kolonne for hver gruppe. Dette er en almindelig operation inden for dataanalyse, især når man arbejder med big data, da det gør det muligt at opsummere og udtrække indsigter fra delmængder af data uden at indlæse alt i hukommelsen på én gang.

Opgave

Swipe to start coding

Skriv en funktion ved hjælp af polars, der grupperer et DataFrame efter en angivet kolonne og beregner gennemsnittet af en anden kolonne for hver gruppe.

  • Funktionen skal tage et pl.DataFrame, en group_col-streng og en value_col-streng som argumenter.
  • Funktionen skal returnere et nyt DataFrame, der indeholder hver unik værdi i group_col og gennemsnittet af value_col for den pågældende gruppe.
  • Det resulterende DataFrame skal have en kolonne med navnet "mean_" efterfulgt af navnet på value_col, som indeholder de beregnede gennemsnitsværdier.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 4
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

some-alt