分類 vs 回帰
メニューを表示するにはスワイプしてください
教師あり機械学習の問題は、一般的に分類と回帰の2つの主要なカテゴリに分けられます。これら2種類の違いを理解することは、データの準備方法、アルゴリズムの選択、結果の解釈に影響するため重要です。いずれの場合も、データセットは特徴量(入力変数)とラベル(予測したいターゲット変数)で構成されていますが、分類と回帰ではラベルの性質が異なります。
分類は、観測値がどのカテゴリやクラスに属するかを予測することです。分類データセットのラベルは離散的で、限られた値の集合を取ります。例えば、メールがスパムかスパムでないかを予測する場合、「spam」と「not spam」という2つのクラスが存在します。出力はカテゴリカルです。
一方、回帰は連続値を予測することです。ここでのラベルは実数であり、この値をできるだけ正確に推定することが目的です。例えば、家の特徴(広さや場所など)に基づいて価格を予測する場合、出力はある範囲内の任意の値となるため、回帰問題となります。
分類と回帰の主な違いは、予測するラベルの種類にあります。分類は離散的なカテゴリ、回帰は連続値です。
分類や回帰の問題は、さまざまな実世界の場面で見られます。分類が適しているタスクの例:
- スパム検出:メールを「spam」または「not spam」と分類
- 医療診断:腫瘍が「良性」か「悪性」かを判定
- 画像認識:写真内の物体を「cat」「dog」「car」などとして識別
回帰は、予測値が連続値となる場合に使用されます。例:
- 場所や広さに基づく家の価格予測
- 過去のデータを用いた株価の予測
- 天候条件から翌日の気温を推定
適切な手法の選択は、データセット内のラベルの種類や予測したい内容によって決まります。
すべて明確でしたか?
フィードバックありがとうございます!
セクション 1. 章 4
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください
セクション 1. 章 4