Datan Yhdistäminen
Pyyhkäise näyttääksesi valikon
Tietojen yhdistäminen useista lähteistä on yleinen tehtävä data wranglingissa, erityisesti kun halutaan rikastaa ensisijaista tietojoukkoa lisäinformaatiolla. Tässä luvussa opit, kuinka yhdistää games_df ja spy_insights_df käyttämällä app_id-saraketta avaimena. Polars tarjoaa joustavat ja tehokkaat yhdistämistoiminnot, joiden avulla tietojoukkojen yhdistäminen ja yhteensopimattomien rivien käsittely on suoraviivaista. Kaksi yleisintä yhdistämistyyppiä ovat left join ja inner join.
Left join palauttaa kaikki rivit vasemmasta DataFrame:stä (games_df) ja lisää oikean DataFrame:n (spy_insights_df) vastaavat rivit. Jos vastaavuutta ei löydy, oikean puolen sarakkeet täytetään null-arvoilla. Inner join palauttaa vain ne rivit, joilla on vastaavuus molemmissa DataFrame:issä, jättäen pois kaikki rivit, joilla ei ole vastaavaa app_id:tä toisessa tietojoukossa.
1234567891011121314151617181920212223import polars as pl # Sample games_df games_df = pl.DataFrame({ "app_id": [1, 2, 3, 4], "game_name": ["Space Quest", "Jungle Run", "Mystery Manor", "Puzzle Island"] }) # Sample spy_insights_df spy_insights_df = pl.DataFrame({ "app_id": [2, 3, 5], "insight": ["High engagement", "Trending", "Low installs"] }) # Left join: all rows from games_df, matched data from spy_insights_df left_joined = games_df.join(spy_insights_df, on="app_id", how="left") print("Left Join Result:") print(left_joined) # Inner join: only rows with matching app_id in both DataFrames inner_joined = games_df.join(spy_insights_df, on="app_id", how="inner") print("\nInner Join Result:") print(inner_joined)
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme