Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Filtrage et Logique Conditionnelle | Changement de paradigme, sélection
Manipulation de Données avec Polars

Filtrage et Logique Conditionnelle

Glissez pour afficher le menu

Le filtrage des données est un aspect fondamental du data wrangling, en particulier lorsque vous souhaitez vous concentrer sur un sous-ensemble spécifique de votre jeu de données. Avec Polars, il est possible d'utiliser des masques booléens pour sélectionner uniquement les lignes qui répondent à votre condition. Supposons que vous disposiez d'un DataFrame nommé games_df avec une colonne price. Pour filtrer les jeux dont le prix est supérieur à 20, vous pouvez utiliser l'approche suivante :

1234567891011
import polars as pl # Example DataFrame games_df = pl.DataFrame({ "name": ["Chess", "Monopoly", "Scrabble", "Catan", "Pandemic"], "price": [10, 25, 15, 35, 22] }) # Filter games with price > 20 filtered_df = games_df.filter(pl.col("price") > 20) print(filtered_df)

Dans cet exemple, seuls les jeux dont le prix est supérieur à 20 sont inclus dans filtered_df.

Il est également possible d'utiliser la logique conditionnelle pour créer de nouvelles colonnes à partir des valeurs des colonnes existantes. La construction pl.when().then().otherwise() permet de catégoriser efficacement les données. Par exemple, il peut être utile de classer chaque jeu dans une catégorie de prix : "Budget" pour les jeux à 15 ou moins, "Standard" pour les prix entre 16 et 30, et "Premium" pour les prix supérieurs à 30. Voici comment ajouter une colonne price_tier à votre DataFrame :

12345678910
games_with_tier = games_df.with_columns( pl.when(pl.col("price") <= 15) .then("Budget") .when((pl.col("price") > 15) & (pl.col("price") <= 30)) .then("Standard") .otherwise("Premium") .alias("price_tier") ) print(games_with_tier)

Cette approche attribue à chaque jeu une catégorie en fonction de son prix, ce qui facilite la segmentation de votre ensemble de données pour une analyse ou une visualisation ultérieure.

question mark

Quelle méthode Polars est utilisée pour attribuer une nouvelle colonne selon plusieurs conditions ?

Sélectionnez la réponse correcte

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 5

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Section 1. Chapitre 5
some-alt