Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Файли CSV | Читання Файлів у Pandas
Перші Кроки з Pandas
course content

Зміст курсу

Перші Кроки з Pandas

Перші Кроки з Pandas

2. Читання Файлів у Pandas

book
Файли CSV

Оскільки pandas є основною бібліотекою для аналізу та обробки даних, однією з її ключових функцій є здатність читати та записувати різні типи файлів, включаючи CSV файли.

CSV (Comma-Separated Values) файл - це текстовий файл, що використовується для зберігання табличних даних, де кожен рядок представляє запис, а стовпці розділені комами.

CSV файл може містити такі дані:

  • Числа: цілі або десяткові значення (наприклад, 42, 3.14);
  • Текст: рядки або категорійні дані (наприклад, John, Active);
  • Дати/Час: часові мітки (наприклад, 2023-12-30);
  • Булеві значення: логічні значення (True, False).

Кожен рядок повинен мати однакову кількість стовпців, а перший рядок часто містить заголовки стовпців.

Функції, такі як read_csv() та to_csv(), дуже корисні для роботи з CSV даними.

Основний синтаксис read_csv() та ключові параметри наступні:

  • filepath_or_buffer: шлях до CSV файлу (рядок або URL);
  • sep: роздільник (за замовчуванням кома ,);
  • header: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);
  • names: список імен стовпців для використання;
  • usecols: стовпці для читання (підмножина стовпців).
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy

Примітка

Переконайтеся, що посилання на набір даних обгорнуте в лапки.

Основний синтаксис to_csv() та ключові параметри наступні:

  • path_or_buf: шлях до файлу або об'єкт, куди слід записати CSV;
  • sep: роздільник для розділення значень (за замовчуванням кома ,);
  • columns: підмножина стовпців для запису (за замовчуванням всі стовпці);
  • header: чи включати назви стовпців як заголовок (за замовчуванням True);
  • index: чи записувати індекси рядків у файл (за замовчуванням True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Завдання

Swipe to start coding

  1. Прочитайте CSV файл у DataFrame.
  2. Відобразьте вміст на вашому екрані.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 1
toggle bottom row

book
Файли CSV

Оскільки pandas є основною бібліотекою для аналізу та обробки даних, однією з її ключових функцій є здатність читати та записувати різні типи файлів, включаючи CSV файли.

CSV (Comma-Separated Values) файл - це текстовий файл, що використовується для зберігання табличних даних, де кожен рядок представляє запис, а стовпці розділені комами.

CSV файл може містити такі дані:

  • Числа: цілі або десяткові значення (наприклад, 42, 3.14);
  • Текст: рядки або категорійні дані (наприклад, John, Active);
  • Дати/Час: часові мітки (наприклад, 2023-12-30);
  • Булеві значення: логічні значення (True, False).

Кожен рядок повинен мати однакову кількість стовпців, а перший рядок часто містить заголовки стовпців.

Функції, такі як read_csv() та to_csv(), дуже корисні для роботи з CSV даними.

Основний синтаксис read_csv() та ключові параметри наступні:

  • filepath_or_buffer: шлях до CSV файлу (рядок або URL);
  • sep: роздільник (за замовчуванням кома ,);
  • header: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);
  • names: список імен стовпців для використання;
  • usecols: стовпці для читання (підмножина стовпців).
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy

Примітка

Переконайтеся, що посилання на набір даних обгорнуте в лапки.

Основний синтаксис to_csv() та ключові параметри наступні:

  • path_or_buf: шлях до файлу або об'єкт, куди слід записати CSV;
  • sep: роздільник для розділення значень (за замовчуванням кома ,);
  • columns: підмножина стовпців для запису (за замовчуванням всі стовпці);
  • header: чи включати назви стовпців як заголовок (за замовчуванням True);
  • index: чи записувати індекси рядків у файл (за замовчуванням True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Завдання

Swipe to start coding

  1. Прочитайте CSV файл у DataFrame.
  2. Відобразьте вміст на вашому екрані.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 1
Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
We're sorry to hear that something went wrong. What happened?
some-alt