Lernen Was ist k-NN | K-NN-Klassifikator

Beginnen wir unser Klassifikationsabenteuer mit der einfachsten Aufgabe – binäre Klassifikation. Angenommen, wir möchten Süßigkeiten als Keks/Nicht-Keks klassifizieren, basierend auf einem einzelnen Merkmal: ihrem Gewicht.

Eine einfache Methode zur Vorhersage der Klasse einer neuen Instanz besteht darin, ihren nächsten Nachbarn zu betrachten. In unserem Beispiel müssen wir eine Süßigkeit finden, deren Gewicht dem der neuen Instanz am ähnlichsten ist.

Das ist die Idee hinter k-Nearest Neighbors (k-NN) – wir betrachten einfach die Nachbarn. Der k-NN-Algorithmus geht davon aus, dass ähnliche Dinge in räumlicher Nähe existieren. Mit anderen Worten: Ähnliche Dinge befinden sich nahe beieinander. Das k im k-NN steht für die Anzahl der Nachbarn, die bei einer Vorhersage berücksichtigt werden.

Im obigen Beispiel haben wir nur 1 Nachbarn betrachtet, daher handelte es sich um den 1-Nearest Neighbor. In der Regel wird k jedoch auf eine größere Zahl gesetzt, da die Betrachtung nur eines Nachbarn unzuverlässig sein kann:

Wenn k (Anzahl der Nachbarn) größer als eins ist, wird die häufigste Klasse in der Nachbarschaft als Vorhersage gewählt. Hier ein Beispiel für die Vorhersage von zwei neuen Instanzen mit k=3:

Wie zu sehen ist, kann die Änderung von k zu unterschiedlichen Vorhersagen führen.

Hinweis

Gelegentlich erzeugt k-NN ein Unentschieden, wenn mehrere Klassen gleichermaßen unter den nächsten Nachbarn vertreten sind. Die meisten Bibliotheken, einschließlich scikit-learn, lösen Unentschieden auf, indem sie die erste Klasse in ihrer internen Reihenfolge auswählen – ein Aspekt, den man beachten sollte, da dies die Reproduzierbarkeit und Interpretation subtil beeinflussen kann.

War alles klar?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 2

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain how to choose the best value for k in k-NN?

What are the advantages and disadvantages of using k-NN for classification?

Can you give a real-world example where k-NN would be useful?

Swipe um das Menü anzuzeigen

Wie zu sehen ist, kann die Änderung von k zu unterschiedlichen Vorhersagen führen.

Hinweis

War alles klar?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 2