Summary  
This chapter explains how supervised learning tasks are divided into classification—predicting discrete labels—and regression—predicting continuous values—based on the nature of the target variable.  

General domain of usage  
Spam detection

教師あり機械学習の問題は、一般的に**分類**と**回帰**の2つの主要なカテゴリに分けられます。これら2種類の違いを理解することは、データの準備方法、アルゴリズムの選択、結果の解釈に影響するため重要です。いずれの場合も、データセットは**特徴量**（入力変数）と**ラベル**（予測したいターゲット変数）で構成されていますが、分類と回帰ではラベルの性質が異なります。



**分類**は、観測値がどのカテゴリやクラスに属するかを予測することです。分類データセットのラベルは離散的で、限られた値の集合を取ります。例えば、メールがスパムかスパムでないかを予測する場合、「spam」と「not spam」という2つのクラスが存在します。出力はカテゴリカルです。

一方、**回帰**は連続値を予測することです。ここでのラベルは実数であり、この値をできるだけ正確に推定することが目的です。例えば、家の特徴（広さや場所など）に基づいて価格を予測する場合、出力はある範囲内の任意の値となるため、回帰問題となります。

分類と回帰の主な違いは、予測するラベルの種類にあります。分類は離散的なカテゴリ、回帰は連続値です。

分類や回帰の問題は、さまざまな実世界の場面で見られます。**分類**が適しているタスクの例：
- スパム検出：メールを「spam」または「not spam」と分類
- 医療診断：腫瘍が「良性」か「悪性」かを判定
- 画像認識：写真内の物体を「cat」「dog」「car」などとして識別

**回帰**は、予測値が連続値となる場合に使用されます。例：
- 場所や広さに基づく家の価格予測
- 過去のデータを用いた株価の予測
- 天候条件から翌日の気温を推定

適切な手法の選択は、データセット内のラベルの種類や予測したい内容によって決まります。

どの記述が分類問題を正しく説明していますか？

Pythonを用いた教師あり機械学習の基本概念を紹介します。分類や回帰といった主要なアイデアを取り上げ、特徴量、ラベル、学習データおよびテストデータなどの重要な用語について説明します。

このセクションでは、機械学習の基礎的な概念を紹介し、教師あり学習、基本的な用語、および機械学習モデルの構築における基本的なワークフローに焦点を当てます。

分類 vs 回帰