Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Kerncontexten Selecteren vs With_columns | Paradigmaverschuiving, Selectie
Data Wrangling met Polars

Kerncontexten Selecteren vs With_columns

Veeg om het menu te tonen

Het is vaak nodig om nieuwe kolommen aan te maken of bestaande kolommen te wijzigen in je Polars DataFrames. Twee essentiële methoden hiervoor zijn select en with_columns. Elke methode heeft een ander doel, en weten wanneer je welke gebruikt helpt je om duidelijkere en efficiëntere code te schrijven. Stel je hebt een games_df DataFrame met kolommen voor positive_reviews, negative_reviews en total_reviews. Stel dat je het percentage positieve beoordelingen per spel wilt berekenen. Je kunt select gebruiken om een nieuw DataFrame te maken met alleen de berekende kolom, of with_columns gebruiken om nieuwe kolommen toe te voegen aan het bestaande DataFrame.

In een videoles zou je een demonstratie van beide benaderingen zien. Eerst wordt select gebruikt om een DataFrame te maken met een nieuwe kolom genaamd positive_pct, berekend als positive_reviews / total_reviews:

1234567891011121314151617181920212223
import polars as pl # Sample DataFrame games_df = pl.DataFrame({ "game": ["Game A", "Game B"], "positive_reviews": [80, 50], "negative_reviews": [20, 50], "total_reviews": [100, 100] }) # Using select to create a new DataFrame with only the calculated column positive_pct_df = games_df.select( (pl.col("positive_reviews") / pl.col("total_reviews")).alias("positive_pct") ) print("Result of select (only positive_pct column):") print(positive_pct_df) # Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print("\nResult of with_columns (original columns plus negative_pct):") print(games_df)

Vervolgens zie je hoe with_columns gebruikt kan worden om een nieuwe kolom, zoals negative_pct, toe te voegen aan het bestaande DataFrame. Deze kolom wordt berekend als negative_reviews / total_reviews:

12345
# Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print(games_df)

Let op dat select een nieuwe DataFrame retourneert met alleen de kolommen die je opgeeft, terwijl with_columns de bestaande DataFrame wijzigt door kolommen toe te voegen of bij te werken. Dit onderscheid is belangrijk bij het bepalen van de structuur van je datatransformaties. Om de verschillen tussen select en with_columns te verduidelijken, bekijk de volgende vergelijkende tabel. Deze tabel geeft de kernverschillen weer en bevat een beknopt voorbeeld voor elke methode.

Wanneer je select gebruikt, maak je een nieuwe DataFrame aan die alleen de door jou gespecificeerde kolommen bevat. Dit is handig wanneer je je wilt richten op een subset van kolommen of berekende waarden. Daarentegen is with_columns ideaal voor het toevoegen van nieuwe kolommen of het bijwerken van bestaande kolommen binnen dezelfde DataFrame, waarbij alle andere kolommen behouden blijven.

question mark

Welke uitspraak beschrijft het verschil tussen select en with_columns in Polars het beste?

Selecteer het correcte antwoord

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 3

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Sectie 1. Hoofdstuk 3
some-alt