Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Challenge: Apply Oversampling | Методи вибірки для великих даних
Обробка Великих Даних з Python
Секція 2. Розділ 4
single

single

Challenge: Apply Oversampling

Свайпніть щоб показати меню

У цьому завданні пропонується попрактикуватися у вирішенні проблеми дисбалансу класів у великому наборі даних шляхом застосування оверсемплінгу. Вам надано DataFrame бібліотеки pandas, який містить цільовий стовпець із дисбалансом класів. Ваше завдання — створити новий DataFrame, у якому міноритарний клас буде збільшено так, щоб обидва класи мали однакову кількість рядків. Ця техніка корисна у випадках, коли потрібно запобігти упередженості моделей до мажоритарного класу.

Завдання

Проведіть, щоб почати кодувати

Маючи DataFrame pandas з дисбалансом класів у цільовому стовпці, створіть новий DataFrame, у якому міноритарний клас буде надсемпльовано так, щоб кожен клас мав однакову кількість рядків, як і клас з найбільшою кількістю.

  • Визначення кількості кожного класу у цільовому стовпці.
  • Визначення класу з максимальною кількістю.
  • Для кожного класу виконання вибірки з поверненням до досягнення максимальної кількості.
  • Об'єднання збалансованих піднаборів у новий DataFrame.
  • Повернення збалансованого DataFrame.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 4
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

some-alt