Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Ydinkontekstit Select vs With_columns | Paradigman Muutos, Valinta
Datan Käsittely Polarsilla

Ydinkontekstit Select vs With_columns

Pyyhkäise näyttääksesi valikon

Polars DataFramejen kanssa työskennellessä on usein tarpeen luoda uusia sarakkeita tai muokata olemassa olevia. Kaksi keskeistä menetelmää tähän ovat select ja with_columns. Molemmilla on oma käyttötarkoituksensa, ja niiden oikea käyttö auttaa kirjoittamaan selkeämpää ja tehokkaampaa koodia. Kuvittele, että käytössäsi on games_df-niminen DataFrame, jossa on sarakkeet positive_reviews, negative_reviews ja total_reviews. Jos haluat laskea pelikohtaisen positiivisten arvostelujen prosenttiosuuden, voit käyttää select-metodia luodaksesi uuden DataFramen, jossa on vain laskettu sarake, tai with_columns-metodia lisätäksesi uuden sarakkeen olemassa olevaan DataFrameen.

Videoluennolla nähtäisiin molempien lähestymistapojen esittely. Ensin käytetään select-metodia uuden sarakkeen, positive_pct, luomiseen. Tämä lasketaan kaavalla positive_reviews / total_reviews:

1234567891011121314151617181920212223
import polars as pl # Sample DataFrame games_df = pl.DataFrame({ "game": ["Game A", "Game B"], "positive_reviews": [80, 50], "negative_reviews": [20, 50], "total_reviews": [100, 100] }) # Using select to create a new DataFrame with only the calculated column positive_pct_df = games_df.select( (pl.col("positive_reviews") / pl.col("total_reviews")).alias("positive_pct") ) print("Result of select (only positive_pct column):") print(positive_pct_df) # Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print("\nResult of with_columns (original columns plus negative_pct):") print(games_df)

Seuraavaksi nähtäisiin, miten with_columns-metodia voidaan käyttää uuden sarakkeen, kuten negative_pct, lisäämiseen olemassa olevaan DataFrameen. Tämä sarake lasketaan kaavalla negative_reviews / total_reviews:

12345
# Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print(games_df)

Huomaa, että select palauttaa uuden DataFramen, jossa on vain määritetyt sarakkeet, kun taas with_columns muokkaa olemassa olevaa DataFramea lisäämällä tai päivittämällä sarakkeita. Tämä ero on tärkeä, kun päätät, miten rakennat tietomuunnoksesi. Selventääksesi select- ja with_columns-metodien eroja, tarkastele seuraavaa vertailutaulukkoa. Taulukko esittelee keskeiset erot ja antaa tiiviin esimerkin kummastakin metodista.

Kun käytät select-metodia, luot uuden DataFrame-olion, joka sisältää vain määrittämäsi sarakkeet. Tämä on hyödyllistä, kun haluat keskittyä tiettyihin sarakkeisiin tai laskettuihin arvoihin. Sen sijaan with_columns soveltuu uusien sarakkeiden lisäämiseen tai olemassa olevien päivittämiseen samaan DataFrameen, säilyttäen kaikki muut sarakkeet.

question mark

Mikä väite kuvaa parhaiten select- ja with_columns-metodien eron Polarissa?

Valitse oikea vastaus

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 3

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Osio 1. Luku 3
some-alt