Файли CSV
Оскільки pandas
є основною бібліотекою для аналізу та обробки даних, однією з її ключових функцій є здатність читати та записувати різні типи файлів, включаючи CSV файли.
CSV (Comma-Separated Values) файл - це текстовий файл, що використовується для зберігання табличних даних, де кожен рядок представляє запис, а стовпці розділені комами.
CSV файл може містити такі дані:
- Числа: цілі або десяткові значення (наприклад,
42
,3.14
); - Текст: рядки або категорійні дані (наприклад,
John
,Active
); - Дати/Час: часові мітки (наприклад,
2023-12-30
); - Булеві значення: логічні значення (
True
,False
).
Кожен рядок повинен мати однакову кількість стовпців, а перший рядок часто містить заголовки стовпців.
Функції, такі як read_csv()
та to_csv()
, дуже корисні для роботи з CSV даними.
Основний синтаксис read_csv()
та ключові параметри наступні:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer
: шлях до CSV файлу (рядок або URL);sep
: роздільник (за замовчуванням кома,
);header
: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);names
: список імен стовпців для використання;usecols
: стовпці для читання (підмножина стовпців).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Примітка
Переконайтеся, що посилання на набір даних обгорнуте в лапки.
Основний синтаксис to_csv()
та ключові параметри наступні:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf
: шлях до файлу або об'єкт, куди слід записати CSV;sep
: роздільник для розділення значень (за замовчуванням кома,
);columns
: підмножина стовпців для запису (за замовчуванням всі стовпці);header
: чи включати назви стовпців як заголовок (за замовчуваннямTrue
);index
: чи записувати індекси рядків у файл (за замовчуваннямTrue
).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
- Прочитайте CSV файл у DataFrame.
- Відобразьте вміст на вашому екрані.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат
Awesome!
Completion rate improved to 3.03
Файли CSV
Свайпніть щоб показати меню
Оскільки pandas
є основною бібліотекою для аналізу та обробки даних, однією з її ключових функцій є здатність читати та записувати різні типи файлів, включаючи CSV файли.
CSV (Comma-Separated Values) файл - це текстовий файл, що використовується для зберігання табличних даних, де кожен рядок представляє запис, а стовпці розділені комами.
CSV файл може містити такі дані:
- Числа: цілі або десяткові значення (наприклад,
42
,3.14
); - Текст: рядки або категорійні дані (наприклад,
John
,Active
); - Дати/Час: часові мітки (наприклад,
2023-12-30
); - Булеві значення: логічні значення (
True
,False
).
Кожен рядок повинен мати однакову кількість стовпців, а перший рядок часто містить заголовки стовпців.
Функції, такі як read_csv()
та to_csv()
, дуже корисні для роботи з CSV даними.
Основний синтаксис read_csv()
та ключові параметри наступні:
pandas.read_csv(filepath_or_buffer, sep=',', header=0, names=None, usecols=None, ...)
filepath_or_buffer
: шлях до CSV файлу (рядок або URL);sep
: роздільник (за замовчуванням кома,
);header
: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);names
: список імен стовпців для використання;usecols
: стовпці для читання (підмножина стовпців).
12345# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Примітка
Переконайтеся, що посилання на набір даних обгорнуте в лапки.
Основний синтаксис to_csv()
та ключові параметри наступні:
pandas.DataFrame.to_csv(path_or_buf=None, sep=',', ..., columns=None, header=True, index=True, ...)
path_or_buf
: шлях до файлу або об'єкт, куди слід записати CSV;sep
: роздільник для розділення значень (за замовчуванням кома,
);columns
: підмножина стовпців для запису (за замовчуванням всі стовпці);header
: чи включати назви стовпців як заголовок (за замовчуваннямTrue
);index
: чи записувати індекси рядків у файл (за замовчуваннямTrue
).
1234567import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
- Прочитайте CSV файл у DataFrame.
- Відобразьте вміст на вашому екрані.
Рішення
Дякуємо за ваш відгук!
Awesome!
Completion rate improved to 3.03single