Filtraggio e Logica Condizionale
Scorri per mostrare il menu
Il filtraggio dei dati è una parte fondamentale del data wrangling, soprattutto quando si desidera concentrarsi su un sottoinsieme specifico del proprio dataset. In Polars, è possibile utilizzare maschere booleane per selezionare solo le righe che soddisfano una determinata condizione. Supponiamo di avere un DataFrame chiamato games_df con una colonna price. Per filtrare i giochi con un prezzo superiore a 20, è possibile utilizzare il seguente approccio:
1234567891011import polars as pl # Example DataFrame games_df = pl.DataFrame({ "name": ["Chess", "Monopoly", "Scrabble", "Catan", "Pandemic"], "price": [10, 25, 15, 35, 22] }) # Filter games with price > 20 filtered_df = games_df.filter(pl.col("price") > 20) print(filtered_df)
In questo esempio, solo i giochi con un prezzo superiore a 20 sono inclusi in filtered_df.
È inoltre possibile utilizzare la logica condizionale per creare nuove colonne in base ai valori delle colonne esistenti. La struttura pl.when().then().otherwise() consente di categorizzare i dati in modo efficiente. Ad esempio, si può voler classificare ogni gioco in una fascia di prezzo: "Budget" per giochi con prezzo pari o inferiore a 15, "Standard" per prezzi tra 16 e 30, e "Premium" per prezzi superiori a 30. Ecco come aggiungere una colonna price_tier al proprio DataFrame:
12345678910games_with_tier = games_df.with_columns( pl.when(pl.col("price") <= 15) .then("Budget") .when((pl.col("price") > 15) & (pl.col("price") <= 30)) .then("Standard") .otherwise("Premium") .alias("price_tier") ) print(games_with_tier)
Questo approccio assegna a ciascun gioco una fascia in base al prezzo, facilitando la segmentazione del dataset per ulteriori analisi o visualizzazioni.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione