Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Kjernekontekster Select vs With_columns | Paradigmeskifte, Seleksjon
Data Wrangling med Polars

Kjernekontekster Select vs With_columns

Sveip for å vise menyen

Du vil ofte trenge å opprette nye kolonner eller endre eksisterende i Polars DataFrames. To sentrale metoder for dette er select og with_columns. Hver metode har sitt eget formål, og å vite når du skal bruke hvilken, hjelper deg å skrive tydeligere og mer effektiv kode. Tenk deg at du har en games_df DataFrame med kolonnene positive_reviews, negative_reviews og total_reviews. Anta at du ønsker å beregne prosentandelen positive anmeldelser for hvert spill. Du kan bruke select for å lage en ny DataFrame med kun den beregnede kolonnen, eller bruke with_columns for å legge til nye kolonner i den eksisterende DataFrame.

I en videoleksjon ville du se en demonstrasjon av begge tilnærmingene. Først ved å bruke select for å lage en DataFrame med en ny kolonne kalt positive_pct, beregnet som positive_reviews / total_reviews:

1234567891011121314151617181920212223
import polars as pl # Sample DataFrame games_df = pl.DataFrame({ "game": ["Game A", "Game B"], "positive_reviews": [80, 50], "negative_reviews": [20, 50], "total_reviews": [100, 100] }) # Using select to create a new DataFrame with only the calculated column positive_pct_df = games_df.select( (pl.col("positive_reviews") / pl.col("total_reviews")).alias("positive_pct") ) print("Result of select (only positive_pct column):") print(positive_pct_df) # Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print("\nResult of with_columns (original columns plus negative_pct):") print(games_df)

Deretter ville du se hvordan with_columns kan brukes til å legge til en ny kolonne, for eksempel negative_pct, i den eksisterende DataFrame. Denne kolonnen beregnes som negative_reviews / total_reviews:

12345
# Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print(games_df)

Merk at select returnerer en ny DataFrame med kun de kolonnene du spesifiserer, mens with_columns endrer den eksisterende DataFrame ved å legge til eller oppdatere kolonner. Dette skillet er viktig når du skal bestemme hvordan du vil strukturere datatransformasjonene dine. For å tydeliggjøre forskjellene mellom select og with_columns, se sammenligningstabellen nedenfor. Denne tabellen viser de viktigste forskjellene og gir et kort eksempel for hver metode.

Når du bruker select, oppretter du en ny DataFrame som kun inneholder kolonnene du spesifiserer. Dette er nyttig når du vil fokusere på et delsett av kolonner eller beregnede verdier. Til sammenligning er with_columns ideell for å legge til nye kolonner eller oppdatere eksisterende kolonner i den samme DataFrame, samtidig som alle andre kolonner beholdes.

question mark

Hvilken påstand beskriver best forskjellen mellom select og with_columns i Polars?

Velg det helt riktige svaret

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 3

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Seksjon 1. Kapittel 3
some-alt