Вивчайте Файли CSV | Зчитування Файлів у Pandas

Секція 2. Розділ 1

single

Свайпніть щоб показати меню

Оскільки pandas є основною бібліотекою для аналізу та обробки даних, однією з її ключових можливостей є читання та запис різних типів файлів, зокрема CSV-файлів.

CSV (Comma-Separated Values) — це текстовий файл для зберігання табличних даних, де кожен рядок є записом, а стовпці розділені комами.

CSV-файл може містити такі типи даних:

Числа: цілі або десяткові значення (наприклад, 42, 3.14);
Текст: рядки або категоріальні дані (наприклад, John, Active);
Дати/Час: часові мітки (наприклад, 2023-12-30);
Булеві значення: логічні значення (True, False).

Кожен рядок повинен містити однакову кількість стовпців, а перший рядок часто містить заголовки стовпців.

Функції, такі як read_csv() та to_csv(), зручні для роботи з CSV-даними.

Базовий синтаксис read_csv() та основні параметри наведено нижче:

Ось оновлена версія з чітким поясненням параметра index_col:

pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, index_col=None, ...)

filepath_or_buffer: шлях до CSV-файлу (рядок або URL);
sep: роздільник (за замовчуванням кома ,);
header: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);
names: список назв стовпців для використання;
usecols: підмножина стовпців для читання;
index_col: стовпець (або список стовпців), який буде встановлено як індекс DataFrame.


              12345
            
# Loading the CSV into a `DataFrame`
import pandas as pd

salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv')
print(salary_data)

Примітка

Переконайтеся, що посилання на набір даних взято в лапки.

Базовий синтаксис to_csv() та основні параметри наведені нижче:

pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)

path_or_buf: шлях до файлу або об'єкт, куди слід записати CSV;
sep: роздільник для відокремлення значень (за замовчуванням кома ,);
columns: підмножина стовпців для запису (за замовчуванням усі стовпці);
header: чи включати імена стовпців як заголовок (за замовчуванням True);
index: чи записувати індекси рядків у файл (за замовчуванням True).


              1234567
            
import pandas as pd

countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']}
countries = pd.DataFrame(countries_data)

countries.to_csv('countries.csv')
print('Done')

Завдання

Проведіть, щоб почати кодувати

Вам надано URL-адресу до CSV-файлу, збережену у змінній file_url.

Зчитайте CSV-файл за вказаною URL-адресою у DataFrame з назвою wine_data.

Рішення

Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів

Все було зрозуміло?

Дякуємо за ваш відгук!

Секція 2. Розділ 1

single

Запитати АІ

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат