Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Challenge: Agrégation de Données avec Polars | Efficient Data Manipulation With Polars
Gestion de Grandes Données avec Python
Section 3. Chapitre 4
single

single

Challenge: Agrégation de Données avec Polars

Glissez pour afficher le menu

Dans ce défi, utilisation de polars pour effectuer efficacement l’agrégation de données sur de grands ensembles de données. Plus précisément, regroupement d’un grand DataFrame par une colonne et calcul de la moyenne d’une autre colonne pour chaque groupe. Opération courante en analyse de données, en particulier avec le big data, permettant de résumer et d’extraire des informations à partir de sous-ensembles de données sans tout charger en mémoire simultanément.

Tâche

Glissez pour commencer à coder

Écrire une fonction utilisant polars qui regroupe un DataFrame selon une colonne spécifiée et calcule la moyenne d'une autre colonne pour chaque groupe.

  • La fonction doit prendre en arguments un pl.DataFrame, une chaîne de caractères group_col et une chaîne de caractères value_col.
  • La fonction doit retourner un nouveau DataFrame contenant chaque valeur unique de group_col et la moyenne de value_col pour ce groupe.
  • Le DataFrame résultant doit comporter une colonne nommée "mean_" suivie du nom de value_col, contenant les valeurs moyennes calculées.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 4
single

single

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

some-alt