Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ データのマージ | 結合と集計
Polarsによるデータ整形

データのマージ

メニューを表示するにはスワイプしてください

複数のソースからデータを統合することは、データ整形において一般的な作業であり、主データセットに追加のインサイトを付加する際によく行われます。本章では、games_df 列をキーとして spy_insights_dfapp_id を結合する方法を学びます。Polars は柔軟かつ効率的な結合操作を提供しており、不一致の行の扱い方を制御しながらデータセットを簡単に結合できます。最も一般的に使用される結合タイプは、左外部結合(left join)内部結合(inner join) です。

左外部結合(left join) は、左側のデータフレーム(games_df)のすべての行を返し、右側のデータフレーム(spy_insights_df)から一致する行を追加します。一致しない場合、右側の列は null 値で埋められます。内部結合(inner join) は、両方のデータフレームに一致する行のみを返し、どちらかのデータフレームに対応する app_id が存在しない行は除外されます。

1234567891011121314151617181920212223
import polars as pl # Sample games_df games_df = pl.DataFrame({ "app_id": [1, 2, 3, 4], "game_name": ["Space Quest", "Jungle Run", "Mystery Manor", "Puzzle Island"] }) # Sample spy_insights_df spy_insights_df = pl.DataFrame({ "app_id": [2, 3, 5], "insight": ["High engagement", "Trending", "Low installs"] }) # Left join: all rows from games_df, matched data from spy_insights_df left_joined = games_df.join(spy_insights_df, on="app_id", how="left") print("Left Join Result:") print(left_joined) # Inner join: only rows with matching app_id in both DataFrames inner_joined = games_df.join(spy_insights_df, on="app_id", how="inner") print("\nInner Join Result:") print(inner_joined)
question mark

games_dfspy_insights_dfapp_idでマージする際、左結合と内部結合の違いを正確に説明している文はどれですか?

正しい答えを選んでください

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 2.  3

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 2.  3
some-alt