Group_by y agregaciones
Desliza para mostrar el menú
La agrupación y agregación de datos es una parte fundamental del procesamiento de datos, especialmente cuando se desea resumir información por categorías. Con Polars, es posible realizar operaciones de agrupamiento y agregación de manera eficiente y en paralelo, lo que lo hace ideal para conjuntos de datos grandes. Supón que tienes un DataFrame llamado games_df con columnas como developer, price, positive_reviews y negative_reviews. Es posible que quieras encontrar el precio promedio y el total de reseñas para cada desarrollador. En Polars, esto se puede lograr utilizando el método group_by, seguido de funciones de agregación como mean y sum.
A continuación se muestra cómo agrupar games_df por la columna developer, calcular el precio promedio y sumar el total de reseñas (combinando reseñas positivas y negativas):
123456789101112131415161718192021import polars as pl # Sample data games_df = pl.DataFrame({ "developer": ["DevA", "DevB", "DevA", "DevC", "DevB"], "price": [10.0, 20.0, 15.0, 30.0, 25.0], "positive_reviews": [100, 150, 200, 80, 120], "negative_reviews": [10, 20, 15, 5, 8] }) # Group by developer, calculate average price and total reviews result = ( games_df .group_by("developer") .agg([ pl.col("price").mean().alias("avg_price"), (pl.col("positive_reviews") + pl.col("negative_reviews")).sum().alias("total_reviews") ]) ) print(result)
¡Gracias por tus comentarios!
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla