Summary  
Demonstrates how to standardize multiple features with StandardScaler so that k-nearest neighbors distance calculations treat each feature equally, and explains how k-NN neighborhoods generalize from circles to spheres (and higher-dimensional hyperspheres).  

General domain of usage  
Classification tasks in machine learning

**k-NN**が単一の特徴量でどのように動作するかを理解しました。次は、**weight**（重さ）と**width**（幅）という2つの特徴量を使う、やや複雑な例に進みます。

この場合、**幅と重さの両方**に基づいて近傍を探す必要があります。しかし、ここで小さな問題が発生します。お菓子のデータをプロットして、何が問題なのか見てみましょう:

重さは**12**から**64**までの範囲ですが、幅は**5**から**12**の間だけです。幅の範囲がはるかに小さいため、お菓子はほぼ垂直に並んでいるように見えます。この状態で距離を計算すると、主に**重さの違い**だけが反映され、幅を考慮していないのと同じになります。

しかし、解決策があります。それは**データのスケーリング**です。

これで重さと幅の両方が同じスケールになり、**ゼロを中心**とした値になります。これは`StandardScaler`の`sklearn`クラスで実現できます。`StandardScaler`は**サンプルの平均**を引き、その結果を**サンプルの標準偏差**で割るだけです:
$$
X_{scaled} = \frac{X - \bar x}{s}
$$


`StandardScaler` はデータを**ゼロ**付近に中心化します。k-NN では中心化は**必須ではありません**が、「重みが負になるのはなぜか」といった混乱を招くことがあります。これは単にコンピュータにデータを提示する方法の一つです。一部のモデルでは**中心化**が必要となるため、デフォルトで `StandardScaler` を用いてスケーリングすることが推奨されます。

実際には、k-Nearest Neighbors を使用する前に**必ず**データをスケーリングする必要があります。データがスケーリングされた状態で、近傍を見つけることができます。

特徴量が2つの場合、k-NN は所定の数の近傍を含む**円形の近傍領域**を定義します。特徴量が3つの場合は、これが**球体**になります。より高次元では、近傍領域は可視化できない複雑な形状となりますが、**基礎となる計算は変わりません**。

正しい記述を選択してください。

Pythonを使用したカテゴリカルな結果を予測するための分類手法を紹介します。分類モデルの構築、トレーニング、評価、決定境界の解釈、一般的なアルゴリズムの実世界データセットへの適用に焦点を当てます。


複数特徴量によるK-NN