Filtrering og betinget logikk
Sveip for å vise menyen
Filtrering av data er en sentral del av datahåndtering, spesielt når du ønsker å fokusere på et spesifikt delsett av datasettet ditt. I Polars kan du bruke boolske masker for å velge kun de radene som oppfyller betingelsen din. Anta at du har en DataFrame kalt games_df med en price-kolonne. For å filtrere etter spill hvor prisen er større enn 20, kan du bruke følgende tilnærming:
1234567891011import polars as pl # Example DataFrame games_df = pl.DataFrame({ "name": ["Chess", "Monopoly", "Scrabble", "Catan", "Pandemic"], "price": [10, 25, 15, 35, 22] }) # Filter games with price > 20 filtered_df = games_df.filter(pl.col("price") > 20) print(filtered_df)
I dette eksemplet er det kun spillene med en pris over 20 som er inkludert i filtered_df.
Du kan også bruke betinget logikk for å opprette nye kolonner basert på verdiene i eksisterende kolonner. Konstruksjonen pl.when().then().otherwise() gjør det mulig å kategorisere data effektivt. For eksempel kan du ønske å klassifisere hvert spill i en priskategori: "Budget" for spill med pris på 15 eller lavere, "Standard" for priser mellom 16 og 30, og "Premium" for priser over 30. Slik kan du legge til en price_tier-kolonne i DataFrame-en din:
12345678910games_with_tier = games_df.with_columns( pl.when(pl.col("price") <= 15) .then("Budget") .when((pl.col("price") > 15) & (pl.col("price") <= 30)) .then("Standard") .otherwise("Premium") .alias("price_tier") ) print(games_with_tier)
Denne tilnærmingen tildeler hvert spill et nivå basert på prisen, noe som gjør det enkelt å segmentere datasettet for videre analyse eller visualisering.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår