Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprenda Contextos Centrais Select vs With_Columns | Mudança de Paradigma, Seleção
Manipulação de Dados com Polars

Contextos Centrais Select vs With_Columns

Deslize para mostrar o menu

Frequentemente, será necessário criar novas colunas ou modificar colunas existentes em seus DataFrames do Polars. Dois métodos essenciais para isso são select e with_columns. Cada um possui uma finalidade distinta, e saber quando utilizar cada um ajudará a escrever códigos mais claros e eficientes. Imagine que você possui um DataFrame chamado games_df com as colunas positive_reviews, negative_reviews e total_reviews. Suponha que você queira calcular a porcentagem de avaliações positivas para cada jogo. Você pode usar select para criar um novo DataFrame apenas com a coluna calculada, ou utilizar with_columns para adicionar novas colunas ao DataFrame existente.

Em uma aula em vídeo, seria apresentada uma demonstração de ambas as abordagens. Primeiro, utilizando select para criar um DataFrame com uma nova coluna chamada positive_pct, calculada como positive_reviews / total_reviews:

1234567891011121314151617181920212223
import polars as pl # Sample DataFrame games_df = pl.DataFrame({ "game": ["Game A", "Game B"], "positive_reviews": [80, 50], "negative_reviews": [20, 50], "total_reviews": [100, 100] }) # Using select to create a new DataFrame with only the calculated column positive_pct_df = games_df.select( (pl.col("positive_reviews") / pl.col("total_reviews")).alias("positive_pct") ) print("Result of select (only positive_pct column):") print(positive_pct_df) # Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print("\nResult of with_columns (original columns plus negative_pct):") print(games_df)

Em seguida, seria mostrado como with_columns pode ser utilizado para adicionar uma nova coluna, como negative_pct, ao DataFrame existente. Esta coluna é calculada como negative_reviews / total_reviews:

12345
# Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print(games_df)

Observe que select retorna um novo DataFrame apenas com as colunas especificadas, enquanto with_columns modifica o DataFrame existente ao adicionar ou atualizar colunas. Essa distinção é importante ao decidir como estruturar as transformações de dados. Para esclarecer as diferenças entre select e with_columns, veja a grade comparativa a seguir. Esta tabela destaca as principais distinções e fornece um exemplo conciso para cada método.

Ao usar select, um novo DataFrame é criado contendo apenas as colunas especificadas. Útil para focar em um subconjunto de colunas ou valores calculados. Em contraste, with_columns é ideal para adicionar novas colunas ou atualizar colunas existentes dentro do mesmo DataFrame, preservando todas as outras colunas.

question mark

Qual afirmação melhor descreve a diferença entre select e with_columns em Polars?

Selecione a resposta correta

Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 3

Pergunte à IA

expand

Pergunte à IA

ChatGPT

Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo

Seção 1. Capítulo 3
some-alt