CSV-Файли
Оскільки pandas є основною бібліотекою для аналізу та обробки даних, однією з її ключових можливостей є читання та запис різних типів файлів, зокрема CSV-файлів.
CSV (Comma-Separated Values) — це текстовий файл для зберігання табличних даних, де кожен рядок є записом, а стовпці розділені комами.
CSV-файл може містити такі дані:
- Числа: цілі або десяткові значення (наприклад,
42,3.14); - Текст: рядки або категоріальні дані (наприклад,
John,Active); - Дати/Час: часові мітки (наприклад,
2023-12-30); - Булеві значення: логічні значення (
True,False).
Кожен рядок повинен містити однакову кількість стовпців, а перший рядок зазвичай містить заголовки стовпців.
Функції, такі як read_csv() та to_csv(), зручні для роботи з CSV-даними.
Базовий синтаксис read_csv() та основні параметри виглядають так:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: шлях до CSV-файлу (рядок або URL);sep: роздільник (за замовчуванням кома,);header: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);names: список назв стовпців для використання;usecols: стовпці для читання (підмножина стовпців).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Переконайтеся, що посилання на набір даних взято в лапки.
Базовий синтаксис to_csv() та основні параметри виглядають так:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: шлях до файлу або об'єкт, куди слід записати CSV;sep: роздільник для відокремлення значень (за замовчуванням кома,);columns: підмножина стовпців для запису (за замовчуванням усі стовпці);header: чи включати імена стовпців як заголовок (за замовчуваннямTrue);index: чи записувати індекси рядків у файл (за замовчуваннямTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Вам надано URL-адресу до CSV-файлу, збережену у змінній file_url.
- Зчитайте CSV-файл за вказаною URL-адресою у
DataFrameз назвоюwine_data.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 3.03
CSV-Файли
Свайпніть щоб показати меню
Оскільки pandas є основною бібліотекою для аналізу та обробки даних, однією з її ключових можливостей є читання та запис різних типів файлів, зокрема CSV-файлів.
CSV (Comma-Separated Values) — це текстовий файл для зберігання табличних даних, де кожен рядок є записом, а стовпці розділені комами.
CSV-файл може містити такі дані:
- Числа: цілі або десяткові значення (наприклад,
42,3.14); - Текст: рядки або категоріальні дані (наприклад,
John,Active); - Дати/Час: часові мітки (наприклад,
2023-12-30); - Булеві значення: логічні значення (
True,False).
Кожен рядок повинен містити однакову кількість стовпців, а перший рядок зазвичай містить заголовки стовпців.
Функції, такі як read_csv() та to_csv(), зручні для роботи з CSV-даними.
Базовий синтаксис read_csv() та основні параметри виглядають так:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer: шлях до CSV-файлу (рядок або URL);sep: роздільник (за замовчуванням кома,);header: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);names: список назв стовпців для використання;usecols: стовпці для читання (підмножина стовпців).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Переконайтеся, що посилання на набір даних взято в лапки.
Базовий синтаксис to_csv() та основні параметри виглядають так:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf: шлях до файлу або об'єкт, куди слід записати CSV;sep: роздільник для відокремлення значень (за замовчуванням кома,);columns: підмножина стовпців для запису (за замовчуванням усі стовпці);header: чи включати імена стовпців як заголовок (за замовчуваннямTrue);index: чи записувати індекси рядків у файл (за замовчуваннямTrue).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
Вам надано URL-адресу до CSV-файлу, збережену у змінній file_url.
- Зчитайте CSV-файл за вказаною URL-адресою у
DataFrameз назвоюwine_data.
Рішення
Дякуємо за ваш відгук!
single