分類とは何か
メニューを表示するにはスワイプしてください
分類は、インスタンスの特徴量を用いてそのクラスを予測する教師あり学習タスク。モデルは訓練データセットのラベル付き例から学習し、未知の新しいデータにクラスを割り当てる。
回帰は連続的な数値(例:価格)を予測し、多くの値を取ることができる。 分類はカテゴリ値(例:お菓子の種類)を予測し、限られたクラスの中から1つを選択する。
分類にはいくつかの種類がある:
- 二値分類(バイナリ分類): ターゲットが2つの可能な結果を持つ場合(スパム/非スパム、クッキー/非クッキー);
- 多クラス分類: 3つ以上のカテゴリが存在する場合(スパム/重要/広告/その他、クッキー/マシュマロ/キャンディ);
- マルチラベル分類: 1つのインスタンスが複数のクラスに同時に属する場合(映画がアクションかつコメディである、メールが重要かつ仕事関連である)。
ほとんどの機械学習モデルでは、ターゲットを数値にエンコードする必要がある。二値分類の場合、結果は通常0/1でエンコードされる(例:1 - cookie、0 - not a cookie)。多クラス分類の場合、結果は通常0, 1, 2, ...でエンコードされる(例:0 - candy、1 - cookie、2 - marshmallow)。
分類を実行できるモデルは多数存在する。例として:
- k-近傍法(k-Nearest Neighbors);
- ロジスティック回帰(Logistic Regression);
- 決定木(Decision Tree);
- ランダムフォレスト(Random Forest)。
これらはすべてscikit-learnライブラリで実装されており、簡単に利用できる。
注意
どの機械学習モデルも他より優れているわけではありません。どのモデルが最も良い結果を出すかは、特定のタスクによって異なります。
すべて明確でしたか?
フィードバックありがとうございます!
セクション 1. 章 1
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください
セクション 1. 章 1