Filtrage et Logique Conditionnelle
Glissez pour afficher le menu
Le filtrage des données est un aspect fondamental du data wrangling, en particulier lorsque vous souhaitez vous concentrer sur un sous-ensemble spécifique de votre jeu de données. Avec Polars, il est possible d'utiliser des masques booléens pour sélectionner uniquement les lignes qui répondent à votre condition. Supposons que vous disposiez d'un DataFrame nommé games_df avec une colonne price. Pour filtrer les jeux dont le prix est supérieur à 20, vous pouvez utiliser l'approche suivante :
1234567891011import polars as pl # Example DataFrame games_df = pl.DataFrame({ "name": ["Chess", "Monopoly", "Scrabble", "Catan", "Pandemic"], "price": [10, 25, 15, 35, 22] }) # Filter games with price > 20 filtered_df = games_df.filter(pl.col("price") > 20) print(filtered_df)
Dans cet exemple, seuls les jeux dont le prix est supérieur à 20 sont inclus dans filtered_df.
Il est également possible d'utiliser la logique conditionnelle pour créer de nouvelles colonnes à partir des valeurs des colonnes existantes. La construction pl.when().then().otherwise() permet de catégoriser efficacement les données. Par exemple, il peut être utile de classer chaque jeu dans une catégorie de prix : "Budget" pour les jeux à 15 ou moins, "Standard" pour les prix entre 16 et 30, et "Premium" pour les prix supérieurs à 30. Voici comment ajouter une colonne price_tier à votre DataFrame :
12345678910games_with_tier = games_df.with_columns( pl.when(pl.col("price") <= 15) .then("Budget") .when((pl.col("price") > 15) & (pl.col("price") <= 30)) .then("Standard") .otherwise("Premium") .alias("price_tier") ) print(games_with_tier)
Cette approche attribue à chaque jeu une catégorie en fonction de son prix, ce qui facilite la segmentation de votre ensemble de données pour une analyse ou une visualisation ultérieure.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion