Leer Wat is k-NN | K-NN-Classificator

Laten we ons classificatie-avontuur beginnen met de eenvoudigste taak - binaire classificatie. Stel dat we snoepjes willen classificeren als koekjes/niet-koekjes op basis van één enkele eigenschap: hun gewicht.

Een eenvoudige manier om de klasse van een nieuw exemplaar te voorspellen is door te kijken naar de dichtstbijzijnde buur. In ons voorbeeld moeten we een snoepje vinden dat qua gewicht het meest lijkt op het nieuwe exemplaar.

Dat is het idee achter k-Nearest Neighbors (k-NN) - we kijken gewoon naar de buren. Het k-NN-algoritme gaat ervan uit dat vergelijkbare dingen zich in nabijheid bevinden. Met andere woorden, vergelijkbare dingen liggen dicht bij elkaar. k in k-NN staat voor het aantal buren dat we meenemen bij het maken van een voorspelling.

In het bovenstaande voorbeeld hebben we slechts 1 buurman overwogen, dus dit was 1-Nearest Neighbor. Meestal wordt k echter op een hoger getal ingesteld, omdat het bekijken van slechts één buurman onbetrouwbaar kan zijn:

Als k (aantal buren) groter is dan één, kiezen we de meest voorkomende klasse in de buurt als voorspelling. Hier is een voorbeeld van het voorspellen van twee nieuwe instanties met k=3:

Zoals je kunt zien, kan het wijzigen van de k tot verschillende voorspellingen leiden.

Opmerking

Soms veroorzaakt k-NN een gelijkspel wanneer meerdere klassen even vaak voorkomen onder de dichtstbijzijnde buren. De meeste bibliotheken, waaronder scikit-learn, lossen gelijkspellen op door de eerste klasse in hun interne volgorde te kiezen - iets om rekening mee te houden, omdat dit subtiel invloed kan hebben op de reproduceerbaarheid en interpretatie.

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 2

Vraag AI

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Suggested prompts:

Can you explain how to choose the best value for k in k-NN?

What are the advantages and disadvantages of using k-NN for classification?

Can you give a real-world example where k-NN would be useful?