single
Challenge: Agrégation de Données avec Polars
Glissez pour afficher le menu
Dans ce défi, utilisation de polars pour effectuer efficacement l’agrégation de données sur de grands ensembles de données. Plus précisément, regroupement d’un grand DataFrame par une colonne et calcul de la moyenne d’une autre colonne pour chaque groupe. Opération courante en analyse de données, en particulier avec le big data, permettant de résumer et d’extraire des informations à partir de sous-ensembles de données sans tout charger en mémoire simultanément.
Glissez pour commencer à coder
Écrire une fonction utilisant polars qui regroupe un DataFrame selon une colonne spécifiée et calcule la moyenne d'une autre colonne pour chaque groupe.
- La fonction doit prendre en arguments un
pl.DataFrame, une chaîne de caractèresgroup_colet une chaîne de caractèresvalue_col. - La fonction doit retourner un nouveau DataFrame contenant chaque valeur unique de
group_colet la moyenne devalue_colpour ce groupe. - Le DataFrame résultant doit comporter une colonne nommée
"mean_"suivie du nom devalue_col, contenant les valeurs moyennes calculées.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion