single
Challenge: Apply Oversampling
Свайпніть щоб показати меню
У цьому завданні пропонується попрактикуватися у вирішенні проблеми дисбалансу класів у великому наборі даних шляхом застосування оверсемплінгу. Вам надано DataFrame бібліотеки pandas, який містить цільовий стовпець із дисбалансом класів. Ваше завдання — створити новий DataFrame, у якому міноритарний клас буде збільшено так, щоб обидва класи мали однакову кількість рядків. Ця техніка корисна у випадках, коли потрібно запобігти упередженості моделей до мажоритарного класу.
Проведіть, щоб почати кодувати
Маючи DataFrame pandas з дисбалансом класів у цільовому стовпці, створіть новий DataFrame, у якому міноритарний клас буде надсемпльовано так, щоб кожен клас мав однакову кількість рядків, як і клас з найбільшою кількістю.
- Визначення кількості кожного класу у цільовому стовпці.
- Визначення класу з максимальною кількістю.
- Для кожного класу виконання вибірки з поверненням до досягнення максимальної кількості.
- Об'єднання збалансованих піднаборів у новий DataFrame.
- Повернення збалансованого DataFrame.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат