Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Ознайомлення з методом .groupby() | Агрегування Даних
Просунуті Техніки в Pandas

bookОзнайомлення з методом .groupby()

Радий вітати вас у цьому розділі. Тут ми будемо групувати наші дані, щоб знаходити інформацію про різні групи рядків. Ознайомтеся з набором даних про затримки (ви можете прокручувати цю таблицю горизонтально):

Групування даних є корисним, і зараз ми розглянемо це детальніше. Уявіть, що потрібно підрахувати кількість затримок для кожного номера рейсу. Перегляньте приклад коду, а потім пояснення:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
copy

Пояснення:

data[['Flight', 'Delay']].groupby('Flight').sum()
  • data[['Flight', 'Delay']] – Це стовпці, з якими ви працюєте, включаючи ті, за якими буде виконуватись групування;
  • groupby('Flight') – Стовпець 'Flight' є аргументом для функції .groupby(). Це означає, що рядки з однаковим значенням у стовпці 'Flight' будуть згруповані разом;
  • .sum() – Ця функція виконується над рядками всередині кожної групи, створеної методом .groupby(). У цьому випадку вона підсумовує значення у стовпці 'Delay' для рядків, що належать до однієї групи 'Flight'.
Note
Примітка

Оскільки стовпець 'Delay' містить лише значення 0 (затримка не відбулася) або 1 (затримка відбулася), сума рядків відображає кількість затримок для кожного рейсу.

Насправді, .sum() — це лише одна з багатьох агрегуючих функцій, які можна використовувати. Ви ознайомитеся з усіма ними у подальших розділах.

question-icon

Заповніть пропуски, щоб знайти середнє значення стовпця 'Time' залежно від стовпця 'DayOfWeek'.

data_extracted = data[['', 'Time']]('').mean()
print(data_extracted)
DayOfWeekTime
3804.993130
4804.452984
5702.888362
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 1

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Awesome!

Completion rate improved to 3.03

bookОзнайомлення з методом .groupby()

Свайпніть щоб показати меню

Радий вітати вас у цьому розділі. Тут ми будемо групувати наші дані, щоб знаходити інформацію про різні групи рядків. Ознайомтеся з набором даних про затримки (ви можете прокручувати цю таблицю горизонтально):

Групування даних є корисним, і зараз ми розглянемо це детальніше. Уявіть, що потрібно підрахувати кількість затримок для кожного номера рейсу. Перегляньте приклад коду, а потім пояснення:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
copy

Пояснення:

data[['Flight', 'Delay']].groupby('Flight').sum()
  • data[['Flight', 'Delay']] – Це стовпці, з якими ви працюєте, включаючи ті, за якими буде виконуватись групування;
  • groupby('Flight') – Стовпець 'Flight' є аргументом для функції .groupby(). Це означає, що рядки з однаковим значенням у стовпці 'Flight' будуть згруповані разом;
  • .sum() – Ця функція виконується над рядками всередині кожної групи, створеної методом .groupby(). У цьому випадку вона підсумовує значення у стовпці 'Delay' для рядків, що належать до однієї групи 'Flight'.
Note
Примітка

Оскільки стовпець 'Delay' містить лише значення 0 (затримка не відбулася) або 1 (затримка відбулася), сума рядків відображає кількість затримок для кожного рейсу.

Насправді, .sum() — це лише одна з багатьох агрегуючих функцій, які можна використовувати. Ви ознайомитеся з усіма ними у подальших розділах.

question-icon

Заповніть пропуски, щоб знайти середнє значення стовпця 'Time' залежно від стовпця 'DayOfWeek'.

data_extracted = data[['', 'Time']]('').mean()
print(data_extracted)
DayOfWeekTime
3804.993130
4804.452984
5702.888362
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 4. Розділ 1
some-alt