single
Challenge: Apply Undersampling
Свайпніть щоб показати меню
У багатьох реальних наборах даних часто виникає проблема дисбалансу класів — коли один клас (більшість) значно переважає інший (меншість). Такий дисбаланс може призводити до того, що моделі віддають перевагу прогнозуванню більшості, знижуючи точність для меншості. Одним із поширених рішень є undersampling — випадкове зменшення кількості зразків у класі більшості до рівня класу меншості. У цьому завданні ви отримаєте практичний досвід застосування цієї техніки. Ви отримаєте DataFrame з категоріальною цільовою колонкою, що містить два класи. Ваша мета — повернути новий DataFrame, у якому обидва класи представлені в однаковій кількості, досягнутої шляхом випадкового undersampling класу більшості.
Проведіть, щоб почати кодувати
Маючи DataFrame з категоріальною цільовою колонкою, що містить два класи, повернути новий DataFrame, у якому обидва класи мають однакову кількість зразків шляхом випадкового андерсемплінгу більшості.
- Визначити, який клас є міноритарним, а який — мажоритарним, підрахувавши кількість зразків для кожного класу.
- Випадково вибрати зразки з мажоритарного класу так, щоб їх кількість відповідала міноритарному класу.
- Об'єднати випадково вибрані зразки мажоритарного класу з усіма зразками міноритарного класу.
- Перемішати отриманий DataFrame і скинути індекс.
Рішення
Дякуємо за ваш відгук!
single
Запитати АІ
Запитати АІ
Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат