Sammanfoga Data
Svep för att visa menyn
Sammanfogning av data från flera källor är en vanlig uppgift inom datahantering, särskilt när du behöver berika din primära datamängd med ytterligare insikter. I detta kapitel lär du dig hur du sammanfogar games_df med spy_insights_df med hjälp av kolumnen app_id som nyckel. Polars erbjuder flexibla och effektiva sammanfogningsoperationer, vilket gör det enkelt att kombinera datamängder samtidigt som du kan styra hur omatchade rader hanteras. De två vanligaste typerna av sammanfogningar du kommer att använda är vänster join och inre join.
En vänster join returnerar alla rader från den vänstra DataFrame (games_df) och lägger till matchande rader från den högra DataFrame (spy_insights_df). Om det inte finns någon matchning fylls kolumnerna från högersidan med null-värden. En inre join returnerar endast rader där det finns en matchning i båda DataFrames och utesluter alla rader från någon av DataFrames som inte har motsvarande app_id i den andra.
1234567891011121314151617181920212223import polars as pl # Sample games_df games_df = pl.DataFrame({ "app_id": [1, 2, 3, 4], "game_name": ["Space Quest", "Jungle Run", "Mystery Manor", "Puzzle Island"] }) # Sample spy_insights_df spy_insights_df = pl.DataFrame({ "app_id": [2, 3, 5], "insight": ["High engagement", "Trending", "Low installs"] }) # Left join: all rows from games_df, matched data from spy_insights_df left_joined = games_df.join(spy_insights_df, on="app_id", how="left") print("Left Join Result:") print(left_joined) # Inner join: only rows with matching app_id in both DataFrames inner_joined = games_df.join(spy_insights_df, on="app_id", how="inner") print("\nInner Join Result:") print(inner_joined)
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal