Об'єднання даних
Свайпніть щоб показати меню
Об'єднання даних з декількох джерел — поширене завдання при підготовці даних, особливо коли потрібно доповнити основний набір додатковою інформацією. У цьому розділі розглядається, як об'єднати games_df з spy_insights_df, використовуючи стовпець app_id як ключ. Polars надає гнучкі та ефективні операції об'єднання, що дозволяє легко комбінувати набори даних і контролювати обробку рядків без відповідників. Найпоширеніші типи об'єднання, які використовуються, — це left join (лівостороннє об'єднання) та inner join (внутрішнє об'єднання).
Left join повертає всі рядки з лівого DataFrame (games_df) і додає відповідні рядки з правого DataFrame (spy_insights_df). Якщо відповідника немає, стовпці з правої таблиці заповнюються значеннями null. Inner join повертає лише ті рядки, для яких є відповідник у обох DataFrame, ігноруючи всі рядки, які не мають відповідного app_id в іншій таблиці.
1234567891011121314151617181920212223import polars as pl # Sample games_df games_df = pl.DataFrame({ "app_id": [1, 2, 3, 4], "game_name": ["Space Quest", "Jungle Run", "Mystery Manor", "Puzzle Island"] }) # Sample spy_insights_df spy_insights_df = pl.DataFrame({ "app_id": [2, 3, 5], "insight": ["High engagement", "Trending", "Low installs"] }) # Left join: all rows from games_df, matched data from spy_insights_df left_joined = games_df.join(spy_insights_df, on="app_id", how="left") print("Left Join Result:") print(left_joined) # Inner join: only rows with matching app_id in both DataFrames inner_joined = games_df.join(spy_insights_df, on="app_id", how="inner") print("\nInner Join Result:") print(inner_joined)
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат