Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Файли CSV | Читання Файлів у Pandas
Перші Кроки з Pandas

Свайпніть щоб показати меню

book
Файли CSV

Оскільки pandas є основною бібліотекою для аналізу та обробки даних, однією з її ключових функцій є здатність читати та записувати різні типи файлів, включаючи CSV файли.

CSV (Comma-Separated Values) файл - це текстовий файл, що використовується для зберігання табличних даних, де кожен рядок представляє запис, а стовпці розділені комами.

CSV файл може містити такі дані:

  • Числа : цілі або десяткові значення (наприклад, 42 , 3.14 );

  • Текст : рядки або категорійні дані (наприклад, John , Active );

  • Дати/Час : часові мітки (наприклад, 2023-12-30 );

  • Булеві значення : логічні значення ( True , False ).

Кожен рядок повинен мати однакову кількість стовпців, а перший рядок часто містить заголовки стовпців.

Функції, такі як read_csv() та to_csv(), дуже корисні для роботи з CSV даними.

Основний синтаксис read_csv() та ключові параметри наступні:

python
  • filepath_or_buffer : шлях до CSV файлу (рядок або URL);

  • sep : роздільник (за замовчуванням кома , );

  • header : номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);

  • names : список імен стовпців для використання;

  • usecols : стовпці для читання (підмножина стовпців).

12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy

Примітка

Переконайтеся, що посилання на набір даних обгорнуте в лапки.

Основний синтаксис to_csv() та ключові параметри наступні:

python
  • path_or_buf : шлях до файлу або об'єкт, куди слід записати CSV;

  • sep : роздільник для розділення значень (за замовчуванням кома , );

  • columns : підмножина стовпців для запису (за замовчуванням всі стовпці);

  • header : чи включати назви стовпців як заголовок (за замовчуванням True );

  • index : чи записувати індекси рядків у файл (за замовчуванням True ).

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Завдання

Swipe to start coding

  1. Прочитайте CSV файл у DataFrame.
  2. Відобразьте вміст на вашому екрані.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 1

Запитати АІ

expand
ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

book
Файли CSV

Оскільки pandas є основною бібліотекою для аналізу та обробки даних, однією з її ключових функцій є здатність читати та записувати різні типи файлів, включаючи CSV файли.

CSV (Comma-Separated Values) файл - це текстовий файл, що використовується для зберігання табличних даних, де кожен рядок представляє запис, а стовпці розділені комами.

CSV файл може містити такі дані:

  • Числа : цілі або десяткові значення (наприклад, 42 , 3.14 );

  • Текст : рядки або категорійні дані (наприклад, John , Active );

  • Дати/Час : часові мітки (наприклад, 2023-12-30 );

  • Булеві значення : логічні значення ( True , False ).

Кожен рядок повинен мати однакову кількість стовпців, а перший рядок часто містить заголовки стовпців.

Функції, такі як read_csv() та to_csv(), дуже корисні для роботи з CSV даними.

Основний синтаксис read_csv() та ключові параметри наступні:

python
  • filepath_or_buffer : шлях до CSV файлу (рядок або URL);

  • sep : роздільник (за замовчуванням кома , );

  • header : номер рядка для використання як заголовки стовпців (за замовчуванням перший рядок);

  • names : список імен стовпців для використання;

  • usecols : стовпці для читання (підмножина стовпців).

12345
# Loading the CSV into a `DataFrame` import pandas as pd salary_data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a43d24b6-df61-4e11-9c90-5b36552b3437/Salary+Dataset.csv') print(salary_data)
copy

Примітка

Переконайтеся, що посилання на набір даних обгорнуте в лапки.

Основний синтаксис to_csv() та ключові параметри наступні:

python
  • path_or_buf : шлях до файлу або об'єкт, куди слід записати CSV;

  • sep : роздільник для розділення значень (за замовчуванням кома , );

  • columns : підмножина стовпців для запису (за замовчуванням всі стовпці);

  • header : чи включати назви стовпців як заголовок (за замовчуванням True );

  • index : чи записувати індекси рядків у файл (за замовчуванням True ).

1234567
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) countries.to_csv('countries.csv') print('Done')
copy
Завдання

Swipe to start coding

  1. Прочитайте CSV файл у DataFrame.
  2. Відобразьте вміст на вашому екрані.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 1
Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Ми дуже хвилюємося, що щось пішло не так. Що трапилося?
some-alt