Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ チャレンジ:オーバーサンプリングを適用する | 大規模データのサンプリング手法
Pythonによる大規模データハンドリング
セクション 2.  4
single

single

チャレンジ:オーバーサンプリングを適用する

メニューを表示するにはスワイプしてください

このチャレンジでは、大規模データセットにおけるクラス不均衡の処理として、オーバーサンプリングを実践します。pandasのDataFrameが与えられており、ターゲット列にはクラスの不均衡があります。目的は、マイノリティクラスをオーバーサンプリングし、両クラスの行数が同じになる新しいDataFrameを作成することです。この手法は、モデルがマジョリティクラスに偏るのを防ぎたい場合に有効です。

タスク

スワイプしてコーディングを開始

ターゲット列にクラス不均衡があるpandas DataFrameが与えられた場合、少数クラスをオーバーサンプリングし、すべてのクラスが多数クラスと同じ行数になる新しいDataFrameを作成します。

  • ターゲット列のクラス数を特定。
  • 最大数のクラスを決定。
  • 各クラスについて、最大数に達するまで復元抽出でサンプリング。
  • バランスを取ったサブセットを新しいDataFrameに連結。
  • バランスの取れたDataFrameを返却。

解答

Switch to desktop実践的な練習のためにデスクトップに切り替える下記のオプションのいずれかを利用して、現在の場所から続行する
すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 2.  4
single

single

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

some-alt