Summary  
This chapter explains how logistic regression uses the sigmoid function to predict class probabilities and defines the binary (and categorical) cross-entropy cost function to measure model performance and optimize parameters by minimizing this cost.  

General domain of usage  
Classification tasks in machine learning

ロジスティック回帰では、コンピュータが最適なパラメータ $$β$$ を学習するだけで十分です。そのためには、「最適なパラメータ」とは何かを定義する必要があります。モデルの仕組みを振り返ると、クラス **1** に属する確率 $$p$$ を予測します。

$$
p = \sigma (z) = \sigma (\beta_0 + \beta_1x_1 + ...)
$$

ここで、

$$
\sigma (z) = \frac{1}{1 + e^{-z}}
$$

当然ながら、良いパラメータを持つモデルとは、実際にクラス **1** であるインスタンスに対して高い（1に近い）$$p$$ を予測し、実際にクラス **0** であるインスタンスに対して低い（0に近い）$$p$$ を予測するモデルです。

モデルの良し悪しを測定するために、**コスト関数** を使用します。線形回帰では、コスト関数として **MSE**（平均二乗誤差）を使用しましたが、今回は異なる関数を使用します。

ここで、$$p$$ はモデルによって予測されたクラス **1** に属する確率を表し、$$y$$ は実際のターゲット値を示します。

この関数は誤った予測を罰するだけでなく、**モデルの予測に対する信頼度**も考慮します。上記の画像で示されているように、$$p$$ の値が $$y$$（実際のターゲット）に近い場合、コスト関数は比較的小さくなり、モデルが正しいクラスを自信を持って選択したことを示します。逆に、予測が誤っている場合、コスト関数はモデルが誤ったクラスに自信を持つほど**指数関数的に増加**します。

シグモイド関数を用いた二値分類の文脈では、使用されるコスト関数は特に**バイナリクロスエントロピー損失**と呼ばれ、上記で示されました。また、**多クラス**分類問題で使用される一般的な形として**クロスエントロピー損失**（またはカテゴリカルクロスエントロピー）があることにも注意が必要です。

単一の訓練インスタンスに対するカテゴリカルクロスエントロピー損失は、次のように計算されます：

$$
\text{Categorical Cross-Entropy Loss} = -\sum_{i=1}^{C} y_i \log(p_i)
$$

ここで
- $$C$$ はクラス数；
- $$y_i$$ は実際のターゲット値（そのクラスが正解なら1、そうでなければ0）；
- $$p_i$$ はインスタンスがクラス $$i$$ に属する確率の予測値。

各訓練インスタンスごとに**損失関数**を計算し、その平均を取ります。この平均が**コスト関数**と呼ばれます。ロジスティック回帰は、コスト関数を最小化するパラメータ $$\beta$$ を求めます。

分類タスクで損失として使用されるものはどれですか？

Pythonを使用したカテゴリカルな結果を予測するための分類手法を紹介します。分類モデルの構築、トレーニング、評価、決定境界の解釈、一般的なアルゴリズムの実世界データセットへの適用に焦点を当てます。


パラメータの探索