Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Файли CSV | Читання Файлів у Pandas
Перші Кроки з Pandas

Свайпніть щоб показати меню

book
Файли CSV

Оскільки pandas є основною бібліотекою для аналізу та обробки даних, однією з її ключових функцій є здатність читати та записувати різні типи файлів, включаючи CSV файли.

CSV (Comma-Separated Values) файл - це текстовий файл, що використовується для зберігання табличних даних, де кожен рядок представляє запис, а стовпці розділені комами.

CSV файл може містити такі дані:

  • Числа: цілі або десяткові значення (наприклад, 42, 3.14);

  • Текст: рядки або категорійні дані (наприклад, John, Active);

  • Дати/Час: часові мітки (наприклад, 2023-12-30);

  • Булеві значення: логічні значення (True, False).

Кожен рядок повинен мати однакову кількість стовпців, а перший рядок часто містить заголовки стовпців.

Функції, такі як read_csv() та to_csv(), дуже корисні для роботи з CSV даними.

Основний синтаксис read_csv() та ключові параметри наступні:

python
  • filepath_or_buffer: шлях до CSV файлу (рядок або URL);

  • sep: роздільник (за замовчуванням кома ,);

  • header: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);

  • names: список імен стовпців для використання;

  • usecols: стовпці для читання (підмножина стовпців).

12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy

Примітка

Переконайтеся, що посилання на набір даних обгорнуте в лапки.

Основний синтаксис to_csv() та ключові параметри наступні:

python
  • path_or_buf: шлях до файлу або об'єкт, куди слід записати CSV;

  • sep: роздільник для розділення значень (за замовчуванням кома ,);

  • columns: підмножина стовпців для запису (за замовчуванням всі стовпці);

  • header: чи включати назви стовпців як заголовок (за замовчуванням True);

  • index: чи записувати індекси рядків у файл (за замовчуванням True).

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Завдання

Swipe to start coding

  1. Прочитайте CSV файл у DataFrame.
  2. Відобразьте вміст на вашому екрані.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 1
Ми дуже хвилюємося, що щось пішло не так. Що трапилося?

Запитати АІ

expand
ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

book
Файли CSV

Оскільки pandas є основною бібліотекою для аналізу та обробки даних, однією з її ключових функцій є здатність читати та записувати різні типи файлів, включаючи CSV файли.

CSV (Comma-Separated Values) файл - це текстовий файл, що використовується для зберігання табличних даних, де кожен рядок представляє запис, а стовпці розділені комами.

CSV файл може містити такі дані:

  • Числа: цілі або десяткові значення (наприклад, 42, 3.14);

  • Текст: рядки або категорійні дані (наприклад, John, Active);

  • Дати/Час: часові мітки (наприклад, 2023-12-30);

  • Булеві значення: логічні значення (True, False).

Кожен рядок повинен мати однакову кількість стовпців, а перший рядок часто містить заголовки стовпців.

Функції, такі як read_csv() та to_csv(), дуже корисні для роботи з CSV даними.

Основний синтаксис read_csv() та ключові параметри наступні:

python
  • filepath_or_buffer: шлях до CSV файлу (рядок або URL);

  • sep: роздільник (за замовчуванням кома ,);

  • header: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);

  • names: список імен стовпців для використання;

  • usecols: стовпці для читання (підмножина стовпців).

12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy

Примітка

Переконайтеся, що посилання на набір даних обгорнуте в лапки.

Основний синтаксис to_csv() та ключові параметри наступні:

python
  • path_or_buf: шлях до файлу або об'єкт, куди слід записати CSV;

  • sep: роздільник для розділення значень (за замовчуванням кома ,);

  • columns: підмножина стовпців для запису (за замовчуванням всі стовпці);

  • header: чи включати назви стовпців як заголовок (за замовчуванням True);

  • index: чи записувати індекси рядків у файл (за замовчуванням True).

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Завдання

Swipe to start coding

  1. Прочитайте CSV файл у DataFrame.
  2. Відобразьте вміст на вашому екрані.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 1
Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Ми дуже хвилюємося, що щось пішло не так. Що трапилося?
some-alt