Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Core Contexts Select vs With_Columns | Cambio de Paradigma, Selección
Manipulación de Datos con Polars

Core Contexts Select vs With_Columns

Desliza para mostrar el menú

A menudo será necesario crear nuevas columnas o modificar las existentes en tus DataFrames de Polars. Dos métodos fundamentales para esto son select y with_columns. Cada uno cumple una función diferente, y saber cuándo utilizar cada uno te ayudará a escribir código más claro y eficiente. Imagina que tienes un DataFrame llamado games_df con las columnas positive_reviews, negative_reviews y total_reviews. Supón que deseas calcular el porcentaje de reseñas positivas para cada juego. Puedes usar select para crear un nuevo DataFrame solo con la columna calculada, o utilizar with_columns para añadir nuevas columnas al DataFrame existente.

En una lección en video, verías una demostración de ambos enfoques. Primero, usando select para crear un DataFrame con una nueva columna llamada positive_pct, calculada como positive_reviews / total_reviews:

1234567891011121314151617181920212223
import polars as pl # Sample DataFrame games_df = pl.DataFrame({ "game": ["Game A", "Game B"], "positive_reviews": [80, 50], "negative_reviews": [20, 50], "total_reviews": [100, 100] }) # Using select to create a new DataFrame with only the calculated column positive_pct_df = games_df.select( (pl.col("positive_reviews") / pl.col("total_reviews")).alias("positive_pct") ) print("Result of select (only positive_pct column):") print(positive_pct_df) # Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print("\nResult of with_columns (original columns plus negative_pct):") print(games_df)

A continuación, verías cómo with_columns puede utilizarse para añadir una nueva columna, como negative_pct, al DataFrame existente. Esta columna se calcula como negative_reviews / total_reviews:

12345
# Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print(games_df)

Observa que select devuelve un nuevo DataFrame solo con las columnas que especifiques, mientras que with_columns modifica el DataFrame existente agregando o actualizando columnas. Esta distinción es importante al decidir cómo estructurar las transformaciones de tus datos. Para aclarar las diferencias entre select y with_columns, considera la siguiente tabla comparativa. Esta tabla describe las diferencias principales y proporciona un ejemplo conciso para cada método.

Cuando se utiliza select, se crea un nuevo DataFrame que contiene únicamente las columnas especificadas. Esto resulta útil cuando se desea trabajar con un subconjunto de columnas o valores calculados. En cambio, with_columns es ideal para agregar nuevas columnas o actualizar las existentes dentro del mismo DataFrame, conservando todas las demás columnas.

question mark

¿Cuál afirmación describe mejor la diferencia entre select y with_columns en Polars?

Selecciona la respuesta correcta

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 1. Capítulo 3

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Sección 1. Capítulo 3
some-alt