Базові Операції з Даними в Polars
Свайпніть щоб показати меню
Під час роботи з великими наборами даних ефективна обробка даних є ключовою. Бібліотека polars розроблена для високопродуктивних операцій з даними, що робить її популярним вибором для роботи з великими обсягами даних у Python. У цьому розділі розглядаються способи завантаження даних, вибору конкретних стовпців і фільтрації рядків за допомогою polars. Ці базові дії є основою для складніших трансформацій даних.
У таблиці нижче наведено основні функції в polars для виконання цих базових операцій.
123456789import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Display the first 5 rows print(df.head())
У цьому коді імпортується бібліотека polars і використовується функція pl.read_csv() для завантаження даних з файлу з назвою "data/people.csv". Отриманий DataFrame зберігається у змінній df. Викликавши df.head(), можна переглянути перші п’ять рядків DataFrame, що корисно для швидкого ознайомлення з даними після завантаження.
1234567891011import polars as pl url = "https://staging-content-media-cdn.codefinity.com/b8f3c268-0e60-4ff0-a3ea-f145595033d8/section1/large_file.csv" # Read data from a CSV file df = pl.read_csv(url) # Select the "name" and "age" columns selected = df.select(["Variable name"]) print(selected)
Тут використовується метод select() для вибору лише стовпців "name" та "age" з DataFrame. Це створює новий DataFrame з назвою selected, який містить тільки ці стовпці. Вибір стовпців — це поширена операція, коли потрібно зосередитися на певних частинах даних для подальшого аналізу.
Дякуємо за ваш відгук!
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат