Contesti Principali Select vs With_Columns
Scorri per mostrare il menu
Spesso sarà necessario creare nuove colonne o modificare quelle esistenti nei DataFrame Polars. Due metodi fondamentali per questo scopo sono select e with_columns. Ognuno ha una funzione diversa e sapere quando utilizzare l'uno o l'altro aiuta a scrivere codice più chiaro ed efficiente. Immagina di avere un DataFrame games_df con le colonne positive_reviews, negative_reviews e total_reviews. Supponiamo di voler calcolare la percentuale di recensioni positive per ogni gioco. Puoi usare select per creare un nuovo DataFrame con solo la colonna calcolata, oppure utilizzare with_columns per aggiungere nuove colonne al DataFrame esistente.
In una lezione video, vedresti una dimostrazione di entrambi gli approcci. Prima, usando select per creare un DataFrame con una nuova colonna chiamata positive_pct, calcolata come positive_reviews / total_reviews:
1234567891011121314151617181920212223import polars as pl # Sample DataFrame games_df = pl.DataFrame({ "game": ["Game A", "Game B"], "positive_reviews": [80, 50], "negative_reviews": [20, 50], "total_reviews": [100, 100] }) # Using select to create a new DataFrame with only the calculated column positive_pct_df = games_df.select( (pl.col("positive_reviews") / pl.col("total_reviews")).alias("positive_pct") ) print("Result of select (only positive_pct column):") print(positive_pct_df) # Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print("\nResult of with_columns (original columns plus negative_pct):") print(games_df)
Successivamente, vedresti come with_columns può essere utilizzato per aggiungere una nuova colonna, come negative_pct, al DataFrame esistente. Questa colonna viene calcolata come negative_reviews / total_reviews:
12345# Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print(games_df)
Nota come select restituisce un nuovo DataFrame con solo le colonne specificate, mentre with_columns modifica il DataFrame esistente aggiungendo o aggiornando colonne. Questa distinzione è importante quando si decide come strutturare le trasformazioni dei dati.
Per chiarire le differenze tra select e with_columns, considera la seguente tabella comparativa. Questa tabella evidenzia le distinzioni principali e fornisce un esempio conciso per ciascun metodo.
Quando si utilizza select, si crea un nuovo DataFrame che contiene solo le colonne specificate. Utile quando si desidera concentrarsi su un sottoinsieme di colonne o su valori calcolati. Al contrario, with_columns è ideale per aggiungere nuove colonne o aggiornare quelle esistenti all'interno dello stesso DataFrame, preservando tutte le altre colonne.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione