Sammenfletning af data
Stryg for at vise menuen
Sammenfletning af data fra flere kilder er en almindelig opgave inden for data wrangling, især når det er nødvendigt at berige det primære datasæt med yderligere indsigter. I dette kapitel lærer du, hvordan du sammenføjer games_df med spy_insights_df ved at bruge kolonnen app_id som nøgle. Polars tilbyder fleksible og effektive join-operationer, hvilket gør det enkelt at kombinere datasæt og samtidig styre, hvordan ikke-matchende rækker håndteres. De to mest anvendte join-typer er left join og inner join.
En left join returnerer alle rækker fra venstre DataFrame (games_df) og tilføjer matchende rækker fra højre DataFrame (spy_insights_df). Hvis der ikke er et match, vil kolonnerne fra højre side blive udfyldt med null-værdier. En inner join returnerer kun rækker, hvor der er et match i begge DataFrames, og udelader alle rækker fra begge DataFrames, der ikke har en tilsvarende app_id i den anden.
1234567891011121314151617181920212223import polars as pl # Sample games_df games_df = pl.DataFrame({ "app_id": [1, 2, 3, 4], "game_name": ["Space Quest", "Jungle Run", "Mystery Manor", "Puzzle Island"] }) # Sample spy_insights_df spy_insights_df = pl.DataFrame({ "app_id": [2, 3, 5], "insight": ["High engagement", "Trending", "Low installs"] }) # Left join: all rows from games_df, matched data from spy_insights_df left_joined = games_df.join(spy_insights_df, on="app_id", how="left") print("Left Join Result:") print(left_joined) # Inner join: only rows with matching app_id in both DataFrames inner_joined = games_df.join(spy_insights_df, on="app_id", how="inner") print("\nInner Join Result:") print(inner_joined)
Tak for dine kommentarer!
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat