Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Challenge: Apply Undersampling | Методи вибірки для великих даних
Обробка Великих Даних з Python
Секція 2. Розділ 6
single

single

Challenge: Apply Undersampling

Свайпніть щоб показати меню

У багатьох реальних наборах даних часто виникає проблема дисбалансу класів — коли один клас (більшість) значно переважає інший (меншість). Такий дисбаланс може призводити до того, що моделі віддають перевагу прогнозуванню більшості, знижуючи точність для меншості. Одним із поширених рішень є undersampling — випадкове зменшення кількості зразків у класі більшості до рівня класу меншості. У цьому завданні ви отримаєте практичний досвід застосування цієї техніки. Ви отримаєте DataFrame з категоріальною цільовою колонкою, що містить два класи. Ваша мета — повернути новий DataFrame, у якому обидва класи представлені в однаковій кількості, досягнутої шляхом випадкового undersampling класу більшості.

Завдання

Проведіть, щоб почати кодувати

Маючи DataFrame з категоріальною цільовою колонкою, що містить два класи, повернути новий DataFrame, у якому обидва класи мають однакову кількість зразків шляхом випадкового андерсемплінгу більшості.

  • Визначити, який клас є міноритарним, а який — мажоритарним, підрахувавши кількість зразків для кожного класу.
  • Випадково вибрати зразки з мажоритарного класу так, щоб їх кількість відповідала міноритарному класу.
  • Об'єднати випадково вибрані зразки мажоритарного класу з усіма зразками міноритарного класу.
  • Перемішати отриманий DataFrame і скинути індекс.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 2. Розділ 6
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

some-alt