Зміст курсу
Перші Кроки з Pandas
Перші Кроки з Pandas
Файли CSV
Оскільки pandas
є основною бібліотекою для аналізу та обробки даних, однією з її ключових функцій є здатність читати та записувати різні типи файлів, включаючи CSV файли.
CSV (Comma-Separated Values) файл - це текстовий файл, що використовується для зберігання табличних даних, де кожен рядок представляє запис, а стовпці розділені комами.
CSV файл може містити такі дані:
- Числа: цілі або десяткові значення (наприклад,
42
,3.14
); - Текст: рядки або категорійні дані (наприклад,
John
,Active
); - Дати/Час: часові мітки (наприклад,
2023-12-30
); - Булеві значення: логічні значення (
True
,False
).
Кожен рядок повинен мати однакову кількість стовпців, а перший рядок часто містить заголовки стовпців.
Функції, такі як read_csv()
та to_csv()
, дуже корисні для роботи з CSV даними.
Основний синтаксис read_csv()
та ключові параметри наступні:
filepath_or_buffer
: шлях до CSV файлу (рядок або URL);sep
: роздільник (за замовчуванням кома,
);header
: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);names
: список імен стовпців для використання;usecols
: стовпці для читання (підмножина стовпців).
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Примітка
Переконайтеся, що посилання на набір даних обгорнуте в лапки.
Основний синтаксис to_csv()
та ключові параметри наступні:
path_or_buf
: шлях до файлу або об'єкт, куди слід записати CSV;sep
: роздільник для розділення значень (за замовчуванням кома,
);columns
: підмножина стовпців для запису (за замовчуванням всі стовпці);header
: чи включати назви стовпців як заголовок (за замовчуваннямTrue
);index
: чи записувати індекси рядків у файл (за замовчуваннямTrue
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
- Прочитайте CSV файл у DataFrame.
- Відобразьте вміст на вашому екрані.
Рішення
Дякуємо за ваш відгук!
Файли CSV
Оскільки pandas
є основною бібліотекою для аналізу та обробки даних, однією з її ключових функцій є здатність читати та записувати різні типи файлів, включаючи CSV файли.
CSV (Comma-Separated Values) файл - це текстовий файл, що використовується для зберігання табличних даних, де кожен рядок представляє запис, а стовпці розділені комами.
CSV файл може містити такі дані:
- Числа: цілі або десяткові значення (наприклад,
42
,3.14
); - Текст: рядки або категорійні дані (наприклад,
John
,Active
); - Дати/Час: часові мітки (наприклад,
2023-12-30
); - Булеві значення: логічні значення (
True
,False
).
Кожен рядок повинен мати однакову кількість стовпців, а перший рядок часто містить заголовки стовпців.
Функції, такі як read_csv()
та to_csv()
, дуже корисні для роботи з CSV даними.
Основний синтаксис read_csv()
та ключові параметри наступні:
filepath_or_buffer
: шлях до CSV файлу (рядок або URL);sep
: роздільник (за замовчуванням кома,
);header
: номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);names
: список імен стовпців для використання;usecols
: стовпці для читання (підмножина стовпців).
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
Примітка
Переконайтеся, що посилання на набір даних обгорнуте в лапки.
Основний синтаксис to_csv()
та ключові параметри наступні:
path_or_buf
: шлях до файлу або об'єкт, куди слід записати CSV;sep
: роздільник для розділення значень (за замовчуванням кома,
);columns
: підмножина стовпців для запису (за замовчуванням всі стовпці);header
: чи включати назви стовпців як заголовок (за замовчуваннямTrue
);index
: чи записувати індекси рядків у файл (за замовчуваннямTrue
).
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
Swipe to start coding
- Прочитайте CSV файл у DataFrame.
- Відобразьте вміст на вашому екрані.
Рішення
Дякуємо за ваш відгук!