single
Utmaning: Polarsdataaggregering
Svep för att visa menyn
I denna utmaning kommer du att använda polars för att effektivt utföra dataaggregering på stora datamängder. Du ska specifikt gruppera en stor DataFrame efter en kolumn och beräkna medelvärdet av en annan kolumn för varje grupp. Detta är en vanlig operation inom dataanalys, särskilt vid arbete med big data, eftersom det möjliggör att sammanfatta och utvinna insikter från delmängder av dina data utan att behöva ladda allt i minnet samtidigt.
Svep för att börja koda
Skriv en funktion med polars som grupperar en DataFrame efter en angiven kolumn och beräknar medelvärdet av en annan kolumn för varje grupp.
- Funktionen ska ta en
pl.DataFrame, en stränggroup_coloch en strängvalue_colsom argument. - Funktionen ska returnera en ny DataFrame som innehåller varje unikt värde i
group_colsamt medelvärdet avvalue_colför den gruppen. - Den resulterande DataFrame:n ska ha en kolumn med namnet
"mean_"följt av namnet påvalue_col, som innehåller de beräknade medelvärdena.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal