Group_by e Agregações
Deslize para mostrar o menu
Agrupamento e agregação de dados são partes essenciais da preparação de dados, especialmente quando se deseja resumir informações por categorias. Com o Polars, é possível realizar operações de group-by e agregar resultados de forma eficiente e paralela, tornando-o ideal para grandes conjuntos de dados. Suponha que você tenha um DataFrame chamado games_df com colunas como developer, price, positive_reviews e negative_reviews. Pode ser interessante encontrar o preço médio e o total de avaliações para cada desenvolvedor. No Polars, isso pode ser feito utilizando o método group_by, seguido de funções de agregação como mean e sum.
Veja como agrupar o games_df pela coluna developer, calcular o preço médio e somar o total de avaliações (combinando avaliações positivas e negativas):
123456789101112131415161718192021import polars as pl # Sample data games_df = pl.DataFrame({ "developer": ["DevA", "DevB", "DevA", "DevC", "DevB"], "price": [10.0, 20.0, 15.0, 30.0, 25.0], "positive_reviews": [100, 150, 200, 80, 120], "negative_reviews": [10, 20, 15, 5, 8] }) # Group by developer, calculate average price and total reviews result = ( games_df .group_by("developer") .agg([ pl.col("price").mean().alias("avg_price"), (pl.col("positive_reviews") + pl.col("negative_reviews")).sum().alias("total_reviews") ]) ) print(result)
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo