Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Contesti Principali Select vs With_Columns | Cambiamento di Paradigma, Selezione
Data Wrangling con Polars

Contesti Principali Select vs With_Columns

Scorri per mostrare il menu

Spesso sarà necessario creare nuove colonne o modificare quelle esistenti nei DataFrame Polars. Due metodi fondamentali per questo scopo sono select e with_columns. Ognuno ha una funzione diversa e sapere quando utilizzare l'uno o l'altro aiuta a scrivere codice più chiaro ed efficiente. Immagina di avere un DataFrame games_df con le colonne positive_reviews, negative_reviews e total_reviews. Supponiamo di voler calcolare la percentuale di recensioni positive per ogni gioco. Puoi usare select per creare un nuovo DataFrame con solo la colonna calcolata, oppure utilizzare with_columns per aggiungere nuove colonne al DataFrame esistente.

In una lezione video, vedresti una dimostrazione di entrambi gli approcci. Prima, usando select per creare un DataFrame con una nuova colonna chiamata positive_pct, calcolata come positive_reviews / total_reviews:

1234567891011121314151617181920212223
import polars as pl # Sample DataFrame games_df = pl.DataFrame({ "game": ["Game A", "Game B"], "positive_reviews": [80, 50], "negative_reviews": [20, 50], "total_reviews": [100, 100] }) # Using select to create a new DataFrame with only the calculated column positive_pct_df = games_df.select( (pl.col("positive_reviews") / pl.col("total_reviews")).alias("positive_pct") ) print("Result of select (only positive_pct column):") print(positive_pct_df) # Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print("\nResult of with_columns (original columns plus negative_pct):") print(games_df)

Successivamente, vedresti come with_columns può essere utilizzato per aggiungere una nuova colonna, come negative_pct, al DataFrame esistente. Questa colonna viene calcolata come negative_reviews / total_reviews:

12345
# Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print(games_df)

Nota come select restituisce un nuovo DataFrame con solo le colonne specificate, mentre with_columns modifica il DataFrame esistente aggiungendo o aggiornando colonne. Questa distinzione è importante quando si decide come strutturare le trasformazioni dei dati. Per chiarire le differenze tra select e with_columns, considera la seguente tabella comparativa. Questa tabella evidenzia le distinzioni principali e fornisce un esempio conciso per ciascun metodo.

Quando si utilizza select, si crea un nuovo DataFrame che contiene solo le colonne specificate. Utile quando si desidera concentrarsi su un sottoinsieme di colonne o su valori calcolati. Al contrario, with_columns è ideale per aggiungere nuove colonne o aggiornare quelle esistenti all'interno dello stesso DataFrame, preservando tutte le altre colonne.

question mark

Quale affermazione descrive meglio la differenza tra select e with_columns in Polars?

Seleziona la risposta corretta

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 3

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Sezione 1. Capitolo 3
some-alt