Ydinkontekstit Select vs With_columns
Pyyhkäise näyttääksesi valikon
Polars DataFramejen kanssa työskennellessä on usein tarpeen luoda uusia sarakkeita tai muokata olemassa olevia. Kaksi keskeistä menetelmää tähän ovat select ja with_columns. Molemmilla on oma käyttötarkoituksensa, ja niiden oikea käyttö auttaa kirjoittamaan selkeämpää ja tehokkaampaa koodia. Kuvittele, että käytössäsi on games_df-niminen DataFrame, jossa on sarakkeet positive_reviews, negative_reviews ja total_reviews. Jos haluat laskea pelikohtaisen positiivisten arvostelujen prosenttiosuuden, voit käyttää select-metodia luodaksesi uuden DataFramen, jossa on vain laskettu sarake, tai with_columns-metodia lisätäksesi uuden sarakkeen olemassa olevaan DataFrameen.
Videoluennolla nähtäisiin molempien lähestymistapojen esittely. Ensin käytetään select-metodia uuden sarakkeen, positive_pct, luomiseen. Tämä lasketaan kaavalla positive_reviews / total_reviews:
1234567891011121314151617181920212223import polars as pl # Sample DataFrame games_df = pl.DataFrame({ "game": ["Game A", "Game B"], "positive_reviews": [80, 50], "negative_reviews": [20, 50], "total_reviews": [100, 100] }) # Using select to create a new DataFrame with only the calculated column positive_pct_df = games_df.select( (pl.col("positive_reviews") / pl.col("total_reviews")).alias("positive_pct") ) print("Result of select (only positive_pct column):") print(positive_pct_df) # Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print("\nResult of with_columns (original columns plus negative_pct):") print(games_df)
Seuraavaksi nähtäisiin, miten with_columns-metodia voidaan käyttää uuden sarakkeen, kuten negative_pct, lisäämiseen olemassa olevaan DataFrameen. Tämä sarake lasketaan kaavalla negative_reviews / total_reviews:
12345# Using with_columns to add a new column to the existing DataFrame games_df = games_df.with_columns( (pl.col("negative_reviews") / pl.col("total_reviews")).alias("negative_pct") ) print(games_df)
Huomaa, että select palauttaa uuden DataFramen, jossa on vain määritetyt sarakkeet, kun taas with_columns muokkaa olemassa olevaa DataFramea lisäämällä tai päivittämällä sarakkeita. Tämä ero on tärkeä, kun päätät, miten rakennat tietomuunnoksesi.
Selventääksesi select- ja with_columns-metodien eroja, tarkastele seuraavaa vertailutaulukkoa. Taulukko esittelee keskeiset erot ja antaa tiiviin esimerkin kummastakin metodista.
Kun käytät select-metodia, luot uuden DataFrame-olion, joka sisältää vain määrittämäsi sarakkeet. Tämä on hyödyllistä, kun haluat keskittyä tiettyihin sarakkeisiin tai laskettuihin arvoihin. Sen sijaan with_columns soveltuu uusien sarakkeiden lisäämiseen tai olemassa olevien päivittämiseen samaan DataFrameen, säilyttäen kaikki muut sarakkeet.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme