セクション 2. 章 4
single
チャレンジ:オーバーサンプリングを適用する
メニューを表示するにはスワイプしてください
このチャレンジでは、大規模データセットにおけるクラス不均衡の処理として、オーバーサンプリングを実践します。pandasのDataFrameが与えられており、ターゲット列にはクラスの不均衡があります。目的は、マイノリティクラスをオーバーサンプリングし、両クラスの行数が同じになる新しいDataFrameを作成することです。この手法は、モデルがマジョリティクラスに偏るのを防ぎたい場合に有効です。
タスク
スワイプしてコーディングを開始
ターゲット列にクラス不均衡があるpandas DataFrameが与えられた場合、少数クラスをオーバーサンプリングし、すべてのクラスが多数クラスと同じ行数になる新しいDataFrameを作成します。
- ターゲット列のクラス数を特定。
- 最大数のクラスを決定。
- 各クラスについて、最大数に達するまで復元抽出でサンプリング。
- バランスを取ったサブセットを新しいDataFrameに連結。
- バランスの取れたDataFrameを返却。
解答
すべて明確でしたか?
フィードバックありがとうございます!
セクション 2. 章 4
single
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください