データのマージ
メニューを表示するにはスワイプしてください
複数のソースからデータを統合することは、データ整形において一般的な作業であり、主データセットに追加のインサイトを付加する際によく行われます。本章では、games_df 列をキーとして spy_insights_df と app_id を結合する方法を学びます。Polars は柔軟かつ効率的な結合操作を提供しており、不一致の行の扱い方を制御しながらデータセットを簡単に結合できます。最も一般的に使用される結合タイプは、左外部結合(left join) と 内部結合(inner join) です。
左外部結合(left join) は、左側のデータフレーム(games_df)のすべての行を返し、右側のデータフレーム(spy_insights_df)から一致する行を追加します。一致しない場合、右側の列は null 値で埋められます。内部結合(inner join) は、両方のデータフレームに一致する行のみを返し、どちらかのデータフレームに対応する app_id が存在しない行は除外されます。
1234567891011121314151617181920212223import polars as pl # Sample games_df games_df = pl.DataFrame({ "app_id": [1, 2, 3, 4], "game_name": ["Space Quest", "Jungle Run", "Mystery Manor", "Puzzle Island"] }) # Sample spy_insights_df spy_insights_df = pl.DataFrame({ "app_id": [2, 3, 5], "insight": ["High engagement", "Trending", "Low installs"] }) # Left join: all rows from games_df, matched data from spy_insights_df left_joined = games_df.join(spy_insights_df, on="app_id", how="left") print("Left Join Result:") print(left_joined) # Inner join: only rows with matching app_id in both DataFrames inner_joined = games_df.join(spy_insights_df, on="app_id", how="inner") print("\nInner Join Result:") print(inner_joined)
すべて明確でしたか?
フィードバックありがとうございます!
セクション 2. 章 3
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください
セクション 2. 章 3