Summary  
This chapter covers hyperparameter search strategies for k-nearest neighbors, explaining how GridSearchCV exhaustively tests all combinations of n_neighbors, weights, and p parameters (leading to high computational cost) and how RandomizedSearchCV can sample combinations more efficiently.

General domain of usage  
Hyperparameter optimization in machine learning

`GridSearchCV` を使用する前に、`KNeighborsClassifier` には `n_neighbors` 以外にも多くのハイパーパラメータがあることに注意。重要なものとして `weights` と `p` が挙げられる。

## 重み

デフォルトでは、分類器は `weights='uniform'` を使用し、すべての *k* 近傍が等しく投票する。
`weights='distance'` を設定すると、**より近い近傍がより大きな影響を持つ**ようになり、近くの点がより関連性が高い場合に予測精度が向上することが多い。

## P

`p` パラメータは距離尺度を制御します：

* `p=1`: **マンハッタン距離**;
* `p=2`: **ユークリッド距離**。

`p` パラメータは**任意の正の整数**を指定できます。さまざまな距離尺度がありますが、`p=1` や `p=2` よりも可視化が難しくなります。

`weights`や`p`の詳細が不明でも心配する必要はありません。これらは、**モデルの予測に影響を与えるハイパーパラメータが複数存在する**ことを示すために紹介されています。調整可能なハイパーパラメータの例として扱ってください。


注意

以前は`n_neighbors`のみをチューニングしていました。3つすべてのハイパーパラメータを探索するには、次のようにします:

```python
param_grid = {
    'n_neighbors': [1, 3, 5, 7],
    'weights': ['distance', 'uniform'],
    'p': [1, 2]
}
```

`GridSearchCV` は最適なものを見つけるために **すべての組み合わせ** を試すため、以下のすべてを試行する:

次のような大きなグリッド:

```python
param_grid = {
    'n_neighbors': [...],
    'weights': ['distance', 'uniform'],
    'p': [1, 2, 3, 4, 5]
}
```

は100通りの組み合わせを生成する。5分割交差検証を行う場合、モデルは**500回**学習される。
小規模なデータセットでは問題ないが、大規模なデータセットでは処理が非常に遅くなる。

計算時間を短縮するために、**`RandomizedSearchCV`** は組み合わせの中から**ランダムなサブセット**のみをテストし、通常はフルグリッドサーチよりもはるかに速く有力な結果を見つけることができる。

`GridSearchCV` の主な問題点は、（`param_grid` で指定された）すべての組み合わせを試すため、多くの時間がかかる場合があることである。この記述は正しいか？

機械学習は今やあらゆる場所で利用されています。自分で学びたいと思いませんか？このコースは、機械学習の世界への入門として、基本的な概念の習得、最も人気のあるMLライブラリであるScikit-learnの操作、そして最初の機械学習プロジェクトの構築を学ぶためのものです。
このコースは、Python、Pandas、Numpyの基礎知識を持つ学生を対象としています。

機械学習の概念とMLプロジェクトのワークフローについて学習します。

前処理は、MLプロジェクトにおいて最も重要な段階の一つです。本章では、ほぼすべてのデータセットに必要な前処理手順について解説します。

パイプラインは、すべての前処理ステップとモデルを組み合わせるための便利な方法です。パイプラインを使用することで、モデルの学習や利用がはるかに簡単になります。

モデリングはMLプロジェクトの中で最も楽しい段階です。モデルの構築、チューニング、評価方法を学びましょう。

GridSearchCVの欠点

重み

P