Просунуті Трансформації Polars
Свайпніть щоб показати меню
Під час роботи з великими наборами даних часто виникає потреба підсумовувати або аналізувати дані за групами. У polars методи groupby та агрегації розроблені для високої продуктивності, що дозволяє ефективно обчислювати статистику навіть на масивних даних. Операції groupby дають змогу розділити дані на групи за одним або кількома стовпцями, а потім застосовувати функції, такі як sum, mean або count до кожної групи. Це особливо корисно для завдань на кшталт знаходження середніх продажів по регіонах, загальної кількості проданих товарів за категоріями або максимального значення в кожній групі.
Polars вирізняється тим, що оптимізований для паралельного виконання, тому операції groupby значно швидші порівняно з багатьма іншими бібліотеками для роботи з даними. Можна швидко агрегувати мільйони рядків без проблем із пам’яттю чи швидкістю. Синтаксис також лаконічний і виразний, що робить код легким для читання та підтримки.
Припустимо, у вас є набір даних із записами про продажі, і потрібно знайти загальні та середні продажі для кожної категорії товарів. За допомогою polars це можна зробити всього кількома рядками коду.
12345678910111213141516171819import polars as pl # Create a sample DataFrame df = pl.DataFrame({ "category": ["A", "A", "B", "B", "C", "A"], "sales": [100, 150, 200, 120, 300, 180] }) # Group by 'category' and aggregate total and average sales result = ( df.groupby("category") .agg([ pl.col("sales").sum().alias("total_sales"), pl.col("sales").mean().alias("average_sales") ]) ) print(result)
Код вище групує дані про продажі за category, а потім обчислює як загальні, так і середні продажі для кожної групи. Такий підхід не лише лаконічний, а й надзвичайно ефективний, що робить його практичним для реальних наборів даних, які можуть бути значно більшими за наведений приклад.
Polars підтримує широкий спектр функцій агрегації, таких як min, max, count та користувацькі вирази, що дозволяє адаптувати аналіз під власні потреби. Оскільки polars створено з урахуванням продуктивності, можна бути впевненим у швидкому виконанні завдань groupby та агрегації навіть зі зростанням обсягу даних.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат