Filtrering och Villkorslogik
Svep för att visa menyn
Filtrering av data är en central del av datahantering, särskilt när du vill fokusera på en specifik delmängd av din datamängd. I Polars kan du använda booleska masker för att välja endast de rader som uppfyller ditt villkor. Anta att du har en DataFrame kallad games_df med en kolumn price. För att filtrera fram spel där priset är större än 20 kan du använda följande metod:
1234567891011import polars as pl # Example DataFrame games_df = pl.DataFrame({ "name": ["Chess", "Monopoly", "Scrabble", "Catan", "Pandemic"], "price": [10, 25, 15, 35, 22] }) # Filter games with price > 20 filtered_df = games_df.filter(pl.col("price") > 20) print(filtered_df)
I det här exemplet inkluderas endast de spel med ett pris över 20 i filtered_df.
Du kan också använda villkorslogik för att skapa nya kolumner baserat på värdena i befintliga kolumner. Konstruktionen pl.when().then().otherwise() gör det möjligt att kategorisera data effektivt. Till exempel kan du vilja klassificera varje spel i ett prissegment: "Budget" för spel med pris på 15 eller mindre, "Standard" för priser mellan 16 och 30, och "Premium" för priser över 30. Så här kan du lägga till en kolumn price_tier till din DataFrame:
12345678910games_with_tier = games_df.with_columns( pl.when(pl.col("price") <= 15) .then("Budget") .when((pl.col("price") > 15) & (pl.col("price") <= 30)) .then("Standard") .otherwise("Premium") .alias("price_tier") ) print(games_with_tier)
Detta tillvägagångssätt tilldelar varje spel en nivå baserat på dess pris, vilket gör det enkelt att segmentera din datamängd för vidare analys eller visualisering.
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal