Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Фільтрація Великих Наборів Даних | Робота з великими наборами даних
Обробка Великих Даних з Python
Секція 1. Розділ 5
single

single

Завдання: Фільтрація Великих Наборів Даних

Свайпніть щоб показати меню

Уявіть, що вам потрібно проаналізувати масивний CSV-файл, який містить мільйони записів — занадто великий, щоб завантажити його повністю в оперативну пам'ять. Ваша мета — витягти лише ті рядки, де значення певного стовпця перевищує заданий поріг, і зберегти відфільтровані результати у новий файл. Така ситуація є типовою для аналізу великих обсягів даних, де важлива ефективна обробка з мінімальним використанням пам'яті.

Завдання

Проведіть, щоб почати кодувати

Реалізація функції для обробки великого CSV-файлу частинами з подальшим записом лише тих рядків, у яких значення вказаного стовпця перевищує заданий поріг, у новий файл.

  • Зчитування вхідного CSV-файлу частинами розміром chunk_size.
  • Для кожної частини фільтрація рядків, де значення у стовпці, визначеному параметром column, більше за threshold.
  • Запис усіх відфільтрованих рядків до вихідного CSV-файлу разом із рядком заголовків.
  • Якщо жоден рядок не відповідає умові, у вихідний файл записується лише заголовок.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 5
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

some-alt