single
Utfordring: Polars Dataaggregering
Sveip for å vise menyen
I denne utfordringen skal du bruke polars for å effektivt utføre dataaggregering på store datasett. Du skal spesielt gruppere en stor DataFrame etter én kolonne og beregne gjennomsnittet av en annen kolonne for hver gruppe. Dette er en vanlig operasjon innen dataanalyse, spesielt når du arbeider med store datamengder, siden det lar deg oppsummere og hente innsikt fra delmengder av dataene dine uten å laste alt inn i minnet samtidig.
Sveip for å begynne å kode
Skriv en funksjon ved bruk av polars som grupperer en DataFrame etter en spesifisert kolonne og beregner gjennomsnittet av en annen kolonne for hver gruppe.
- Funksjonen må ta en
pl.DataFrame, engroup_col-streng og envalue_col-streng som argumenter. - Funksjonen må returnere en ny DataFrame som inneholder hver unike verdi i
group_colog gjennomsnittet avvalue_colfor den gruppen. - Den resulterende DataFrame må ha en kolonne kalt
"mean_"etterfulgt av navnet påvalue_col, som inneholder de beregnede gjennomsnittsverdiene.
Løsning
Takk for tilbakemeldingene dine!
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår