Mesclando Dados
Deslize para mostrar o menu
Mesclar dados de múltiplas fontes é uma tarefa comum em data wrangling, especialmente quando é necessário enriquecer o conjunto de dados principal com informações adicionais. Neste capítulo, você aprenderá como unir games_df com spy_insights_df utilizando a coluna app_id como chave. O Polars oferece operações de junção flexíveis e eficientes, facilitando a combinação de conjuntos de dados enquanto permite controlar como as linhas sem correspondência são tratadas. Os dois tipos de junção mais comuns que você utilizará são o left join e o inner join.
Um left join retorna todas as linhas do DataFrame da esquerda (games_df) e adiciona as linhas correspondentes do DataFrame da direita (spy_insights_df). Se não houver correspondência, as colunas do lado direito serão preenchidas com valores nulos. Um inner join retorna apenas as linhas em que há correspondência em ambos os DataFrames, descartando quaisquer linhas de qualquer DataFrame que não possuam um app_id correspondente no outro.
1234567891011121314151617181920212223import polars as pl # Sample games_df games_df = pl.DataFrame({ "app_id": [1, 2, 3, 4], "game_name": ["Space Quest", "Jungle Run", "Mystery Manor", "Puzzle Island"] }) # Sample spy_insights_df spy_insights_df = pl.DataFrame({ "app_id": [2, 3, 5], "insight": ["High engagement", "Trending", "Low installs"] }) # Left join: all rows from games_df, matched data from spy_insights_df left_joined = games_df.join(spy_insights_df, on="app_id", how="left") print("Left Join Result:") print(left_joined) # Inner join: only rows with matching app_id in both DataFrames inner_joined = games_df.join(spy_insights_df, on="app_id", how="inner") print("\nInner Join Result:") print(inner_joined)
Obrigado pelo seu feedback!
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo