Filtrado y Lógica Condicional
Desliza para mostrar el menú
El filtrado de datos es una parte fundamental del procesamiento de datos, especialmente cuando se desea enfocar en un subconjunto específico del conjunto de datos. En Polars, se pueden utilizar máscaras booleanas para seleccionar únicamente las filas que cumplen con una condición determinada. Supón que tienes un DataFrame llamado games_df con una columna price. Para filtrar los juegos cuyo precio es mayor que 20, puedes utilizar el siguiente enfoque:
1234567891011import polars as pl # Example DataFrame games_df = pl.DataFrame({ "name": ["Chess", "Monopoly", "Scrabble", "Catan", "Pandemic"], "price": [10, 25, 15, 35, 22] }) # Filter games with price > 20 filtered_df = games_df.filter(pl.col("price") > 20) print(filtered_df)
En este ejemplo, solo se incluyen en filtered_df los juegos con un precio superior a 20.
También puedes utilizar lógica condicional para crear nuevas columnas basadas en los valores de columnas existentes. La construcción pl.when().then().otherwise() permite categorizar datos de manera eficiente. Por ejemplo, podrías querer clasificar cada juego en un nivel de precio: "Budget" para juegos con precio de 15 o menos, "Standard" para precios entre 16 y 30, y "Premium" para precios superiores a 30. A continuación se muestra cómo agregar una columna price_tier a tu DataFrame:
12345678910games_with_tier = games_df.with_columns( pl.when(pl.col("price") <= 15) .then("Budget") .when((pl.col("price") > 15) & (pl.col("price") <= 30)) .then("Standard") .otherwise("Premium") .alias("price_tier") ) print(games_with_tier)
Este enfoque asigna cada juego a un nivel según su precio, lo que facilita segmentar el conjunto de datos para análisis o visualización posteriores.
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla