Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте CSV-Файли | Читання Файлів у Pandas
Перші кроки з Pandas

bookCSV-Файли

Оскільки pandas є основною бібліотекою для аналізу та обробки даних, однією з її ключових можливостей є читання та запис різних типів файлів, зокрема CSV-файлів.

CSV (Comma-Separated Values) — це текстовий файл для зберігання табличних даних, де кожен рядок є записом, а стовпці розділені комами.

CSV-файл може містити такі дані:

  • Числа: цілі або десяткові значення (наприклад, 42, 3.14);
  • Текст: рядки або категоріальні дані (наприклад, John, Active);
  • Дати/Час: часові мітки (наприклад, 2023-12-30);
  • Булеві значення: логічні значення (True, False).

Кожен рядок повинен містити однакову кількість стовпців, а перший рядок зазвичай містить заголовки стовпців.

Функції, такі як read_csv() та to_csv(), зручні для роботи з CSV-даними.

Базовий синтаксис read_csv() та основні параметри виглядають так:

pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
  • filepath_or_buffer: шлях до CSV-файлу (рядок або URL);
  • sep: роздільник (за замовчуванням кома ,);
  • header: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);
  • names: список назв стовпців для використання;
  • usecols: стовпці для читання (підмножина стовпців).
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy
Note
Примітка

Переконайтеся, що посилання на набір даних взято в лапки.

Базовий синтаксис to_csv() та основні параметри виглядають так:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf: шлях до файлу або об'єкт, куди слід записати CSV;
  • sep: роздільник для відокремлення значень (за замовчуванням кома ,);
  • columns: підмножина стовпців для запису (за замовчуванням усі стовпці);
  • header: чи включати імена стовпців як заголовок (за замовчуванням True);
  • index: чи записувати індекси рядків у файл (за замовчуванням True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Завдання

Swipe to start coding

Вам надано URL-адресу до CSV-файлу, збережену у змінній file_url.

  • Зчитайте CSV-файл за вказаною URL-адресою у DataFrame з назвою wine_data.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 1
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

close

Awesome!

Completion rate improved to 3.03

bookCSV-Файли

Свайпніть щоб показати меню

Оскільки pandas є основною бібліотекою для аналізу та обробки даних, однією з її ключових можливостей є читання та запис різних типів файлів, зокрема CSV-файлів.

CSV (Comma-Separated Values) — це текстовий файл для зберігання табличних даних, де кожен рядок є записом, а стовпці розділені комами.

CSV-файл може містити такі дані:

  • Числа: цілі або десяткові значення (наприклад, 42, 3.14);
  • Текст: рядки або категоріальні дані (наприклад, John, Active);
  • Дати/Час: часові мітки (наприклад, 2023-12-30);
  • Булеві значення: логічні значення (True, False).

Кожен рядок повинен містити однакову кількість стовпців, а перший рядок зазвичай містить заголовки стовпців.

Функції, такі як read_csv() та to_csv(), зручні для роботи з CSV-даними.

Базовий синтаксис read_csv() та основні параметри виглядають так:

pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
  • filepath_or_buffer: шлях до CSV-файлу (рядок або URL);
  • sep: роздільник (за замовчуванням кома ,);
  • header: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);
  • names: список назв стовпців для використання;
  • usecols: стовпці для читання (підмножина стовпців).
12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy
Note
Примітка

Переконайтеся, що посилання на набір даних взято в лапки.

Базовий синтаксис to_csv() та основні параметри виглядають так:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
  • path_or_buf: шлях до файлу або об'єкт, куди слід записати CSV;
  • sep: роздільник для відокремлення значень (за замовчуванням кома ,);
  • columns: підмножина стовпців для запису (за замовчуванням усі стовпці);
  • header: чи включати імена стовпців як заголовок (за замовчуванням True);
  • index: чи записувати індекси рядків у файл (за замовчуванням True).
1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Завдання

Swipe to start coding

Вам надано URL-адресу до CSV-файлу, збережену у змінній file_url.

  • Зчитайте CSV-файл за вказаною URL-адресою у DataFrame з назвою wine_data.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 1
single

single

some-alt